a*g
2 楼
http://weibo.com/p/230418713863a50102w408
Deepmind,蜘蛛坦克,小笼包
2016年1月28日 14:39 阅读 97 新浪博客
总觉得要写点什么。
今天的流程是这样的,正常上班,9点一个哈欠坐在电脑前面,发现昨天回家前多删了
一个括号,晚上的script跑错了,修掉一个bug。Reorg在即,无心做新feature。于是
刷手机。这时候微信群黑白子有人说平下赢职业,没链接,光文字,这是出来的第一个
消息,当时大约9点半。不是太相信,马上拿了keywords放狗搜,找到blog,和油管上
Unlisted video,这是第一个链接,放在微信群“计算机围棋”里,炸了。想圈人(主
要是FB的Tian)起床看新闻,感觉不好意思。刘知青老师马上不睡觉看完video,这个
时候有其他中文媒体新闻流出,李喆一转就被删。我去FB发第一篇消息,标题是“WTF
”。然后拉video到末尾看到nature番号,但是nature官网遍寻不到。Video越看越真,
说用了两个DNN,一个做policy,一个做evaluation。Fan Hui的名字出现了。问黑白子
消息来源是不是Aja Huang,消息来源说要保密。这时候FB小田起床了,在群里确认新
闻,说已经看过paper,是self-play产生的三千万盘棋。
插一句,self-play反正我是一直想做的,当然估计也不会是只有我一个。之前的一个
小实验也没收敛所以就放弃了。而且用DNN做局面分析是我之前严肃提议过的。这个时
候第一波感情袭来,bitter-sweet。
然后想到老年棋友ZhiPing,怕老年人不看微信,于是直接一个电话过去,第一句是:
有人把你的《墨绿》做出来了。Zhiping反应过来穿上万精油马甲上微博的时候已经被
别人圈了,说哎呀还是慢了一步。不过后来弈客把他的《墨绿》放在头版头条说来来来
我们看先知,还是倍儿有面子。
这个时候我FB上面7d以上组分成两派,一部分认为Fan Hui臭棋,一部分认为说臭棋的
是臭棋。争论不下。然后正式新闻出来了,狗狗,Nature,果壳,全方位出动。最权威
的Computer-GoList出了一封信标题是“GameOver?”,确认的差不多的时候,AjaHuang
出现了发了一封信说是的是的我们做好了。然后就是一波看棋谱看论文看报道的高潮。
后来的事情大家都知道了。
当天接下来的很长时间里我手机每2分钟响一次。FB,微信,甚至还有Email过来说hi,
看到这个新闻想到你了最近过得怎么样。根本没空一个一个回。
这个时候第二波感情袭来,what now?
狗狗做的事情,self-play,用自己的data来train自己的网络,是我一直提议的方向。
用网络迅速做evaluation function,也是如此。我不做的原因主要有三点,一点是因
为自己要上班,一点是因为没硬件,一点是因为雇不起我的partner们(他们都比我牛
逼太多了)。所以关键是没钱。想到之前朋友送我10块钱彩票没中Powerball,不禁悲
从中来。
所以这个事情就是这样,如果狗狗用了其他我没想到的方法做出来这件事情,我也许会
一边觉得哦原来可以那么做,一边悄悄地不死心地还是把自己的方法再去试一遍。或者
狗狗用了我想到的方法但是没做出来,做了半天还是5/6d,我会彻底放弃然后等天才小
田去研究解空间不平滑的问题。但是现在狗狗用了跟我想法几乎一样的、这么毛糙的土
办法就是这么做出来了,连不甘心都不给人留一份。WHATNOW?
觉得心里很重要的一块东西噗的一记,不见了。
所以谈到这里已经不是谈狗狗了,是谈自己了。你们一个个看了波士顿围棋故事然后说
要自传自传的。这就是自传了。
前几年有一个电影,好像是太极三部曲,不出所料里面有个男小孩暗恋师傅的女儿,表
白失败后他去国外学了机械,很多年后做出一只超大蜘蛛坦克,跑回来反攻师门。其实
我一直想做一个这样的坦克,然后跑回去反攻师门。师门下面反正世界冠军很多,不记
得我一个被劝退的小喽啰。这下被狗狗一搞,坦克做不成了。现在不要说师门了,连整
个武林都处于一种恐慌的境地:怎么易筋经变成在线课程啦?
所以,不要说老纸二十年知识储备都是为了这件project,客气一点讲这是给自己脸上
贴金,不客气一点讲这是三十好几的人还是逃不开这个幼年阴影。看看现在能不能借狗
狗的东风,彻底抛弃这个一直在haunting的鬼魂。扔掉围棋,再重新捡起来。
这大概是第三波感情袭来,哦,前女友也结婚了。
没多久之前在亚马逊丛林走山路,看到太阳从上面照下来,先被高的树挡掉,然后阴影
里长满藤曼,藤曼下是烂掉的枯叶和泥水,蚂蚁从一棵树跑到另一棵树,把这些叶子变
成屎,烂在土里,再长成树,长到顶,长出叶子,去被阳光照着。突然觉得地球无非是
一颗电池。能量从太阳过来,在地球上转换再转换,就这样几十亿年。生命和电池,哪
里还有分别。我们努力进化,进化出一个会吃小笼包的生命形式,以便跟电池区分。告
诉歌者,看,我们的熵低!
所以回到狗狗的棋,章北海说,谁都一样。没有狗狗,会有猫猫,没有小田,会有小申
。这肯定不是智能的第一步,甚至都不是智能的关键一步,这只是智能的平常一步。碳
基低熵体还有很长的路要走,硅基低熵体还刚刚出现,天知道后面是什么。
大概是诗和远方。
好饿。
1/28/2016。@波士顿。
Deepmind,蜘蛛坦克,小笼包
2016年1月28日 14:39 阅读 97 新浪博客
总觉得要写点什么。
今天的流程是这样的,正常上班,9点一个哈欠坐在电脑前面,发现昨天回家前多删了
一个括号,晚上的script跑错了,修掉一个bug。Reorg在即,无心做新feature。于是
刷手机。这时候微信群黑白子有人说平下赢职业,没链接,光文字,这是出来的第一个
消息,当时大约9点半。不是太相信,马上拿了keywords放狗搜,找到blog,和油管上
Unlisted video,这是第一个链接,放在微信群“计算机围棋”里,炸了。想圈人(主
要是FB的Tian)起床看新闻,感觉不好意思。刘知青老师马上不睡觉看完video,这个
时候有其他中文媒体新闻流出,李喆一转就被删。我去FB发第一篇消息,标题是“WTF
”。然后拉video到末尾看到nature番号,但是nature官网遍寻不到。Video越看越真,
说用了两个DNN,一个做policy,一个做evaluation。Fan Hui的名字出现了。问黑白子
消息来源是不是Aja Huang,消息来源说要保密。这时候FB小田起床了,在群里确认新
闻,说已经看过paper,是self-play产生的三千万盘棋。
插一句,self-play反正我是一直想做的,当然估计也不会是只有我一个。之前的一个
小实验也没收敛所以就放弃了。而且用DNN做局面分析是我之前严肃提议过的。这个时
候第一波感情袭来,bitter-sweet。
然后想到老年棋友ZhiPing,怕老年人不看微信,于是直接一个电话过去,第一句是:
有人把你的《墨绿》做出来了。Zhiping反应过来穿上万精油马甲上微博的时候已经被
别人圈了,说哎呀还是慢了一步。不过后来弈客把他的《墨绿》放在头版头条说来来来
我们看先知,还是倍儿有面子。
这个时候我FB上面7d以上组分成两派,一部分认为Fan Hui臭棋,一部分认为说臭棋的
是臭棋。争论不下。然后正式新闻出来了,狗狗,Nature,果壳,全方位出动。最权威
的Computer-GoList出了一封信标题是“GameOver?”,确认的差不多的时候,AjaHuang
出现了发了一封信说是的是的我们做好了。然后就是一波看棋谱看论文看报道的高潮。
后来的事情大家都知道了。
当天接下来的很长时间里我手机每2分钟响一次。FB,微信,甚至还有Email过来说hi,
看到这个新闻想到你了最近过得怎么样。根本没空一个一个回。
这个时候第二波感情袭来,what now?
狗狗做的事情,self-play,用自己的data来train自己的网络,是我一直提议的方向。
用网络迅速做evaluation function,也是如此。我不做的原因主要有三点,一点是因
为自己要上班,一点是因为没硬件,一点是因为雇不起我的partner们(他们都比我牛
逼太多了)。所以关键是没钱。想到之前朋友送我10块钱彩票没中Powerball,不禁悲
从中来。
所以这个事情就是这样,如果狗狗用了其他我没想到的方法做出来这件事情,我也许会
一边觉得哦原来可以那么做,一边悄悄地不死心地还是把自己的方法再去试一遍。或者
狗狗用了我想到的方法但是没做出来,做了半天还是5/6d,我会彻底放弃然后等天才小
田去研究解空间不平滑的问题。但是现在狗狗用了跟我想法几乎一样的、这么毛糙的土
办法就是这么做出来了,连不甘心都不给人留一份。WHATNOW?
觉得心里很重要的一块东西噗的一记,不见了。
所以谈到这里已经不是谈狗狗了,是谈自己了。你们一个个看了波士顿围棋故事然后说
要自传自传的。这就是自传了。
前几年有一个电影,好像是太极三部曲,不出所料里面有个男小孩暗恋师傅的女儿,表
白失败后他去国外学了机械,很多年后做出一只超大蜘蛛坦克,跑回来反攻师门。其实
我一直想做一个这样的坦克,然后跑回去反攻师门。师门下面反正世界冠军很多,不记
得我一个被劝退的小喽啰。这下被狗狗一搞,坦克做不成了。现在不要说师门了,连整
个武林都处于一种恐慌的境地:怎么易筋经变成在线课程啦?
所以,不要说老纸二十年知识储备都是为了这件project,客气一点讲这是给自己脸上
贴金,不客气一点讲这是三十好几的人还是逃不开这个幼年阴影。看看现在能不能借狗
狗的东风,彻底抛弃这个一直在haunting的鬼魂。扔掉围棋,再重新捡起来。
这大概是第三波感情袭来,哦,前女友也结婚了。
没多久之前在亚马逊丛林走山路,看到太阳从上面照下来,先被高的树挡掉,然后阴影
里长满藤曼,藤曼下是烂掉的枯叶和泥水,蚂蚁从一棵树跑到另一棵树,把这些叶子变
成屎,烂在土里,再长成树,长到顶,长出叶子,去被阳光照着。突然觉得地球无非是
一颗电池。能量从太阳过来,在地球上转换再转换,就这样几十亿年。生命和电池,哪
里还有分别。我们努力进化,进化出一个会吃小笼包的生命形式,以便跟电池区分。告
诉歌者,看,我们的熵低!
所以回到狗狗的棋,章北海说,谁都一样。没有狗狗,会有猫猫,没有小田,会有小申
。这肯定不是智能的第一步,甚至都不是智能的关键一步,这只是智能的平常一步。碳
基低熵体还有很长的路要走,硅基低熵体还刚刚出现,天知道后面是什么。
大概是诗和远方。
好饿。
1/28/2016。@波士顿。
r*e
3 楼
能展开谈谈吗?H1B费用大概是多少啊?
这样很难让人判断啊。
这样很难让人判断啊。
c*n
4 楼
大牛你这个博客是写给自己看得吧
完全意识流
完全意识流
m*a
6 楼
啥叫candidate?就是不拿phd学位去工作?
c*e
7 楼
candidate就是过了prelim了,不打算拿到学位吗?
p*7
8 楼
这个还真是满低的。。。
k*r
12 楼
Are you kidding me?
t*n
13 楼
中国人开的startup小公司???
别去了
别去了
u*i
14 楼
太少了吧, 而且h1会不会批啊??
c*e
15 楼
candidate啥也不是。你还是把phd给从标题里去了吧。
说自己是MS吧
说自己是MS吧
i*9
16 楼
大家别误会, ee Phd candidate 是 ee本科毕业的意思
相关阅读
请教client 与server node.js 写的api 如何进行安全验证c++posix多线程问题请教perl sprintf question converting dec to hex如何录制在线视频? (转载)ReactJS可以和backbone,requirejs一块用啊。放弃scala是英明的决策微博抢红包并发怎么设计?monad就是一chaining pattern问个问题版上有多少人github的个人项目有超过100个星星?show一下?问个java8问题GMAIL上不去,而GOOGLE的其他产品都可以,这是什么原因?别争语言了,讨论一下push framework吧我还是认为scala的程序员水平高类成员函数调用其它函数1st class citizenWhat is the difference between Haskell and ClojureXSLT其实就是functional programming请教一个Android的简单HTTP REST编程问题 (转载)这么多牛人有时间在这里灌水, 不如一起写一个更好的mitbbs.