Redian新闻
>
人工智能阿法元, 无师自通100:0完爆阿法狗 (转载)
avatar
人工智能阿法元, 无师自通100:0完爆阿法狗 (转载)# Joke - 肚皮舞运动
H*g
1
【 以下文字转载自 Military 讨论区 】
发信人: arthir (阿瑟~不懂), 信区: Military
标 题: 人工智能阿法元, 无师自通100:0完爆阿法狗
发信站: BBS 未名空间站 (Thu Oct 19 01:22:44 2017, 美东)
去年,一个器人读遍人世所有的棋谱,辛勤打谱,
苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此
人间无敌手。他的名字叫阿法狗。
今年,他的弟弟只靠一副棋盘和黑白两子,没看
过一个棋谱,也没有一个人指点,从零开始,自娱自
乐,自己参悟,100-0打败哥哥阿法狗。他的名字叫
阿法元。
DeepMind这项伟大的突破,今天以Mastering
the game of Go without human knowledge为题,
发表于Nature,引起轰动。知社特邀国内外几位人
工智能专家,给予深度解析和点评。
文末有DeepMind David Silver博士专访视频。
特别致谢Nature和DeepMind提供讯息和资料授权。
Nature今天上线的这篇重磅论文,详细介绍了
谷歌DeepMind团队最新的研究成果。人工智能的一
项重要目标,是在没有任何先验知识的前提下,通
过完全的自学,在极具挑战的领域,达到超人的境
地。去年,阿法狗(AlphaGo)代表人工智能在围棋
领域首次战胜了人类的世界冠军,但其棋艺的精进,
是建立在计算机通过海量的历史棋谱学习参悟人类
棋艺的基础之上,进而自我训练,实现超越。
可是今天,我们发现,人类其实把阿法狗教坏了!
新一代的阿法元(AlphaGo Zero), 完全从零开始,不需
要任何历史棋谱的指引,更不需要参考人类任何的先验
知识,完全靠自己一个人强化学习(reinforcement
learning)和参悟, 棋艺增长远超阿法狗,百战百胜,
击溃阿法狗100-0。
达到这样一个水准,阿法元只需要在4个TPU上,花
三天时间,自己左右互搏490万棋局。而它的哥哥阿法
狗,需要在48个TPU上,花几个月的时间,学习三千万
棋局,才打败人类。
avatar
d*o
2
游戏学习不用给label,最后输赢判断规则简单
别的学习还是需要数据支持的
物理法则支配的过程倒是和这个类似,
比如蛋白折叠什么的
最后好像也只用比较下能量就能判断叠得好不好
说不定可以学习出一些规律来预测结构,
在量子计算机暴力求解之前先灌点水

【在 H********g 的大作中提到】
: 【 以下文字转载自 Military 讨论区 】
: 发信人: arthir (阿瑟~不懂), 信区: Military
: 标 题: 人工智能阿法元, 无师自通100:0完爆阿法狗
: 发信站: BBS 未名空间站 (Thu Oct 19 01:22:44 2017, 美东)
: 去年,一个器人读遍人世所有的棋谱,辛勤打谱,
: 苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此
: 人间无敌手。他的名字叫阿法狗。
: 今年,他的弟弟只靠一副棋盘和黑白两子,没看
: 过一个棋谱,也没有一个人指点,从零开始,自娱自
: 乐,自己参悟,100-0打败哥哥阿法狗。他的名字叫

avatar
H*g
3


【在 d****o 的大作中提到】
: 游戏学习不用给label,最后输赢判断规则简单
: 别的学习还是需要数据支持的
: 物理法则支配的过程倒是和这个类似,
: 比如蛋白折叠什么的
: 最后好像也只用比较下能量就能判断叠得好不好
: 说不定可以学习出一些规律来预测结构,
: 在量子计算机暴力求解之前先灌点水

avatar
H*g
4
别让别人听去了

【在 H********g 的大作中提到】
: 嘘
avatar
G*U
5
这个真是一个big deal。
人类的知识进化到现在,给人类以自豪傲慢的一个“好的”借口。
拥有知识的傲慢,教授啊,科学家啊,专家学者,et al。
好像比拥有财富的傲慢,拥有权力的傲慢,更高尚合理
那么一点点。
各种傲慢的印象对我刺激很深。
现在突然发现人类的知识精英其实可以说是用最笨的方法
瞎学,学来学去其实没学对,不知道昏到哪里去了。正如
陶哲轩计算美国总统大选。
一切傲慢都只值得鄙视和忽视。啊哈!

【在 H********g 的大作中提到】
: 别让别人听去了
avatar
H*g
6
其实每年全国都涌现 好几千十几岁的小娃 知识水平达到锁人一辈子的最高水平 差
不多的事情

【在 G******U 的大作中提到】
: 这个真是一个big deal。
: 人类的知识进化到现在,给人类以自豪傲慢的一个“好的”借口。
: 拥有知识的傲慢,教授啊,科学家啊,专家学者,et al。
: 好像比拥有财富的傲慢,拥有权力的傲慢,更高尚合理
: 那么一点点。
: 各种傲慢的印象对我刺激很深。
: 现在突然发现人类的知识精英其实可以说是用最笨的方法
: 瞎学,学来学去其实没学对,不知道昏到哪里去了。正如
: 陶哲轩计算美国总统大选。
: 一切傲慢都只值得鄙视和忽视。啊哈!

avatar
H*g
7
目前人类剩下最保险的能力是不是创新能力?虽然很多其实是被启发的小小扩展

【在 H********g 的大作中提到】
: 其实每年全国都涌现 好几千十几岁的小娃 知识水平达到锁人一辈子的最高水平 差
: 不多的事情

avatar
d*o
8
说不定近期mechanistic model的要吃一阵屎
机器学习弄出来的空气动力或者气候模型要压搞PDE/ODE的人一头

【在 H********g 的大作中提到】
: 嘘
avatar
a*e
9
杩欎笢瑗挎樉鐒舵嬁鏉ヨ櫄鎷熺倰鑲¤瘯璇曞晩
绗簩浠惰骞茬殑灏辨槸鑷浜哄伐鏅鸿兘缂栫▼
鎴栬灏辩紪绋嬪厛鎶婇┈宸ヤ滑閮芥悶姝br />
瀵箇鈥唖鈥唍搴旇鎷垮幓鎼濱MO
銆鍦dakedo(澶ц潓铓 鐨勫ぇ浣滀腑鎻愬埌: 銆br />

: 璇翠笉瀹氳繎鏈焟
echanistic model鐨勮鍚冧竴闃靛睅

: 鏈哄櫒瀛︿範寮勫嚭鏉ョ殑绌烘皵鍔ㄥ姏鎴栬姘斿妯″瀷瑕佸帇鎼濸DE/ODE
鐨勪汉涓ご

:

avatar
d*o
10
乱码

65533;
ODE

【在 a***e 的大作中提到】
: 杩欎笢瑗挎樉鐒舵嬁鏉ヨ櫄鎷熺倰鑲¤瘯璇曞晩
: 绗簩浠惰骞茬殑灏辨槸鑷浜哄伐鏅鸿兘缂栫▼
: 鎴栬灏辩紪绋嬪厛鎶婇┈宸ヤ滑閮芥悶姝br />
: 瀵箇鈥唖鈥唍搴旇鎷垮幓鎼濱MO
: 銆鍦dakedo(澶ц潓铓 鐨勫ぇ浣滀腑鎻愬埌: 銆br />
:
: 璇翠笉瀹氳繎鏈焟
: echanistic model鐨勮鍚冧竴闃靛睅
:
: 鏈哄櫒瀛︿範寮勫嚭鏉ョ殑绌烘皵鍔ㄥ姏鎴栬姘斿妯″瀷瑕佸帇鎼濸DE/ODE
: 鐨勪汉涓ご
:
:

avatar
H*g
11
大叔锯学习一下

【在 d****o 的大作中提到】
: 乱码
:
: 65533;
: ODE

avatar
y*i
12
我觉得人类思维最特别的地方是可以不按常理出牌,还会瞎联想。
例如,“我们中出了一个叛徒”“滚滚长江都是水”“掌声不要!停!不要!停……不
要停!”这类的笑话,电脑恐怕就比较难创造。

【在 H********g 的大作中提到】
: 目前人类剩下最保险的能力是不是创新能力?虽然很多其实是被启发的小小扩展
avatar
H*g
13
你这最后一句是哪个片里看到的

【在 y****i 的大作中提到】
: 我觉得人类思维最特别的地方是可以不按常理出牌,还会瞎联想。
: 例如,“我们中出了一个叛徒”“滚滚长江都是水”“掌声不要!停!不要!停……不
: 要停!”这类的笑话,电脑恐怕就比较难创造。

avatar
y*i
14
那是小损样的经典之一啊。

【在 H********g 的大作中提到】
: 你这最后一句是哪个片里看到的
avatar
r*z
15
其实所谓的创新就是思考小概率的可能性并实现,因为大多数动物或人付不起所谓创新
的代价。

【在 H********g 的大作中提到】
: 目前人类剩下最保险的能力是不是创新能力?虽然很多其实是被启发的小小扩展
avatar
n*d
16
阿法元是石头里蹦出来的吗?

【在 G******U 的大作中提到】
: 这个真是一个big deal。
: 人类的知识进化到现在,给人类以自豪傲慢的一个“好的”借口。
: 拥有知识的傲慢,教授啊,科学家啊,专家学者,et al。
: 好像比拥有财富的傲慢,拥有权力的傲慢,更高尚合理
: 那么一点点。
: 各种傲慢的印象对我刺激很深。
: 现在突然发现人类的知识精英其实可以说是用最笨的方法
: 瞎学,学来学去其实没学对,不知道昏到哪里去了。正如
: 陶哲轩计算美国总统大选。
: 一切傲慢都只值得鄙视和忽视。啊哈!

avatar
d*f
17
我很奇怪为什么下棋算智能,说实话下棋者中以边走一步规则如此明确,搜索空间这么
小,人怎么可能玩的过电脑阿

【在 H********g 的大作中提到】
: 目前人类剩下最保险的能力是不是创新能力?虽然很多其实是被启发的小小扩展
avatar
H*g
18
关键围棋这回电脑不是暴力破解的。如果是5子棋,跳棋,那电脑赢确实是一点都不奇
怪。

【在 d********f 的大作中提到】
: 我很奇怪为什么下棋算智能,说实话下棋者中以边走一步规则如此明确,搜索空间这么
: 小,人怎么可能玩的过电脑阿

avatar
S*E
19
其实电脑下五子棋并没有能够碾压人类一流棋手。
阿尔法狗可以尝试攻克人类最后的一块棋类领地。

【在 H********g 的大作中提到】
: 关键围棋这回电脑不是暴力破解的。如果是5子棋,跳棋,那电脑赢确实是一点都不奇
: 怪。

avatar
s*d
20
搜索空间很大。人类又很笨,没办法造出来速度很快的电脑,所以只好搞一些奇技淫巧
来解决此类问题。

【在 d********f 的大作中提到】
: 我很奇怪为什么下棋算智能,说实话下棋者中以边走一步规则如此明确,搜索空间这么
: 小,人怎么可能玩的过电脑阿

avatar
d*f
21
我一直得观点就是围棋是人类越容易输给电脑的棋类游戏,因为围棋一开始的搜索空间
特别大,而且前面的所谓起手都是xjb下,这次其实不用人类棋谱的阿法元大胜学习人
类棋谱的阿法狗正好证明我这个观点。到了后面的,人类下的几乎都是local minimum,
因为搜索空间对人脑来说还是太大了,电脑只要算法好,算力足,完全不会stuck在
local MINIMUM. 什么人类狗屁棋王完全0胜算

【在 H********g 的大作中提到】
: 关键围棋这回电脑不是暴力破解的。如果是5子棋,跳棋,那电脑赢确实是一点都不奇
: 怪。

avatar
f*n
22
掌握规则后电脑完全可以创造出无数这样的笑话。然而电脑不会因此笑出来或者cpu升
频什么的
笑话对电脑没有意义,电脑也没有所谓有意义的一生,要产生类人文明现在还是不可能
的。最多像蜂群蚂蚁一样低质群体本能罢了

【在 y****i 的大作中提到】
: 我觉得人类思维最特别的地方是可以不按常理出牌,还会瞎联想。
: 例如,“我们中出了一个叛徒”“滚滚长江都是水”“掌声不要!停!不要!停……不
: 要停!”这类的笑话,电脑恐怕就比较难创造。

avatar
d*f
23
关键就是well define这个规则,规则定好的东西人脑没有任何可能玩的过电脑,但是
电脑永远也不会制定规则,这些ai的人真是cs学界的刷管工,每天尽想放几个大卫星

【在 f*****n 的大作中提到】
: 掌握规则后电脑完全可以创造出无数这样的笑话。然而电脑不会因此笑出来或者cpu升
: 频什么的
: 笑话对电脑没有意义,电脑也没有所谓有意义的一生,要产生类人文明现在还是不可能
: 的。最多像蜂群蚂蚁一样低质群体本能罢了

avatar
S*E
24
你的这个人工智能是以逗肉人发笑为目的,终究是落了下乘。

【在 d********f 的大作中提到】
: 关键就是well define这个规则,规则定好的东西人脑没有任何可能玩的过电脑,但是
: 电脑永远也不会制定规则,这些ai的人真是cs学界的刷管工,每天尽想放几个大卫星

avatar
f*n
25
是的
电脑基本上就是一个大号计算器。两头在外注定只是傀儡

【在 d********f 的大作中提到】
: 关键就是well define这个规则,规则定好的东西人脑没有任何可能玩的过电脑,但是
: 电脑永远也不会制定规则,这些ai的人真是cs学界的刷管工,每天尽想放几个大卫星

avatar
l*y
26
阿发狗下了个肉球,他爹一刀劈开出来的

【在 n***d 的大作中提到】
: 阿法元是石头里蹦出来的吗?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。