人工智能阿法元, 无师自通100:0完爆阿法狗 (转载)# Joke - 肚皮舞运动
H*g
1 楼
【 以下文字转载自 Military 讨论区 】
发信人: arthir (阿瑟~不懂), 信区: Military
标 题: 人工智能阿法元, 无师自通100:0完爆阿法狗
发信站: BBS 未名空间站 (Thu Oct 19 01:22:44 2017, 美东)
去年,一个器人读遍人世所有的棋谱,辛勤打谱,
苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此
人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看
过一个棋谱,也没有一个人指点,从零开始,自娱自
乐,自己参悟,100-0打败哥哥阿法狗。他的名字叫
阿法元。
DeepMind这项伟大的突破,今天以Mastering
the game of Go without human knowledge为题,
发表于Nature,引起轰动。知社特邀国内外几位人
工智能专家,给予深度解析和点评。
文末有DeepMind David Silver博士专访视频。
特别致谢Nature和DeepMind提供讯息和资料授权。
Nature今天上线的这篇重磅论文,详细介绍了
谷歌DeepMind团队最新的研究成果。人工智能的一
项重要目标,是在没有任何先验知识的前提下,通
过完全的自学,在极具挑战的领域,达到超人的境
地。去年,阿法狗(AlphaGo)代表人工智能在围棋
领域首次战胜了人类的世界冠军,但其棋艺的精进,
是建立在计算机通过海量的历史棋谱学习参悟人类
棋艺的基础之上,进而自我训练,实现超越。
可是今天,我们发现,人类其实把阿法狗教坏了!
新一代的阿法元(AlphaGo Zero), 完全从零开始,不需
要任何历史棋谱的指引,更不需要参考人类任何的先验
知识,完全靠自己一个人强化学习(reinforcement
learning)和参悟, 棋艺增长远超阿法狗,百战百胜,
击溃阿法狗100-0。
达到这样一个水准,阿法元只需要在4个TPU上,花
三天时间,自己左右互搏490万棋局。而它的哥哥阿法
狗,需要在48个TPU上,花几个月的时间,学习三千万
棋局,才打败人类。
发信人: arthir (阿瑟~不懂), 信区: Military
标 题: 人工智能阿法元, 无师自通100:0完爆阿法狗
发信站: BBS 未名空间站 (Thu Oct 19 01:22:44 2017, 美东)
去年,一个器人读遍人世所有的棋谱,辛勤打谱,
苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此
人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看
过一个棋谱,也没有一个人指点,从零开始,自娱自
乐,自己参悟,100-0打败哥哥阿法狗。他的名字叫
阿法元。
DeepMind这项伟大的突破,今天以Mastering
the game of Go without human knowledge为题,
发表于Nature,引起轰动。知社特邀国内外几位人
工智能专家,给予深度解析和点评。
文末有DeepMind David Silver博士专访视频。
特别致谢Nature和DeepMind提供讯息和资料授权。
Nature今天上线的这篇重磅论文,详细介绍了
谷歌DeepMind团队最新的研究成果。人工智能的一
项重要目标,是在没有任何先验知识的前提下,通
过完全的自学,在极具挑战的领域,达到超人的境
地。去年,阿法狗(AlphaGo)代表人工智能在围棋
领域首次战胜了人类的世界冠军,但其棋艺的精进,
是建立在计算机通过海量的历史棋谱学习参悟人类
棋艺的基础之上,进而自我训练,实现超越。
可是今天,我们发现,人类其实把阿法狗教坏了!
新一代的阿法元(AlphaGo Zero), 完全从零开始,不需
要任何历史棋谱的指引,更不需要参考人类任何的先验
知识,完全靠自己一个人强化学习(reinforcement
learning)和参悟, 棋艺增长远超阿法狗,百战百胜,
击溃阿法狗100-0。
达到这样一个水准,阿法元只需要在4个TPU上,花
三天时间,自己左右互搏490万棋局。而它的哥哥阿法
狗,需要在48个TPU上,花几个月的时间,学习三千万
棋局,才打败人类。