s*w
2 楼
会做饭菜的男主,不多见啊。
====================================================
厨房中已经放了整套厨具,柜中满是食材。夜瞳看着两眼放光,就连千夜也忍不住想要
显一显身手了。
此刻已是晩饭时间,夜瞳即道:“我来做饭吧!”
“一起。”千夜微笑道。
两人换下战斗服,一起动手下厨,一边讲些各自生活中的有趣事,时时会开怀大笑。
千夜在旁看了,不禁失笑,从夜瞳手中接过菜刀,随手拿起一块鱼段。在千夜手中
,菜刀忽如有了灵性,绕着鱼身上下飞舞,片片薄如纸片的鱼肉就如雪片纷落,堆在盘
中。到得最后,千夜手上就只剩一根光溜溜的鱼刺。
夜瞳看得目瞪口呆。
千夜笑着在她头上敲了一起,说:“怎么了?”
夜瞳毕竟还是少女心性,脸上已经有了雀跃和期待,问道:“你还会做饭?”
两人笑闹之间,晚餐已经准备好了,帝国风格的几个小菜,一碗清汤。千夜又拿出
一瓶酒,各自倒了一杯。
两人相对坐下,相视一笑,就动筷开饭。一桌饭菜,转眼间就被消灭,夜瞳还意犹
未尽,眼巴巴地看着千夜,最后看得千夜举手投降,跑到厨房里又炒了几个菜,这才算
把她喂饱。
吃饱喝足,夜瞳心满意足地把自己埋进沙发里,轻轻一脚,将千夜踹到厨房里去洗
碗。
片刻之后,千夜把一切收拾干净,才走进客厅,见夜瞳正靠在沙发上,抱着一本书
看得出神。
自回来之后,千夜还没有注意到茶几上摆的是什么书,于是走到沙发后,凑上去问
:“在看什么?”
夜瞳并没有回答,而是转过脸,反手勾住千夜脖子,把他拉了下来,吻了上去。
这一下,就如同往军火库里扔了根火把,转眼间就引爆了整个客厅。
====================================================
厨房中已经放了整套厨具,柜中满是食材。夜瞳看着两眼放光,就连千夜也忍不住想要
显一显身手了。
此刻已是晩饭时间,夜瞳即道:“我来做饭吧!”
“一起。”千夜微笑道。
两人换下战斗服,一起动手下厨,一边讲些各自生活中的有趣事,时时会开怀大笑。
千夜在旁看了,不禁失笑,从夜瞳手中接过菜刀,随手拿起一块鱼段。在千夜手中
,菜刀忽如有了灵性,绕着鱼身上下飞舞,片片薄如纸片的鱼肉就如雪片纷落,堆在盘
中。到得最后,千夜手上就只剩一根光溜溜的鱼刺。
夜瞳看得目瞪口呆。
千夜笑着在她头上敲了一起,说:“怎么了?”
夜瞳毕竟还是少女心性,脸上已经有了雀跃和期待,问道:“你还会做饭?”
两人笑闹之间,晚餐已经准备好了,帝国风格的几个小菜,一碗清汤。千夜又拿出
一瓶酒,各自倒了一杯。
两人相对坐下,相视一笑,就动筷开饭。一桌饭菜,转眼间就被消灭,夜瞳还意犹
未尽,眼巴巴地看着千夜,最后看得千夜举手投降,跑到厨房里又炒了几个菜,这才算
把她喂饱。
吃饱喝足,夜瞳心满意足地把自己埋进沙发里,轻轻一脚,将千夜踹到厨房里去洗
碗。
片刻之后,千夜把一切收拾干净,才走进客厅,见夜瞳正靠在沙发上,抱着一本书
看得出神。
自回来之后,千夜还没有注意到茶几上摆的是什么书,于是走到沙发后,凑上去问
:“在看什么?”
夜瞳并没有回答,而是转过脸,反手勾住千夜脖子,把他拉了下来,吻了上去。
这一下,就如同往军火库里扔了根火把,转眼间就引爆了整个客厅。
a*g
3 楼
发信人: nightwizard (JK), 信区: Weiqi
标 题: Master只用了一个GPU
发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
的意思吧)
2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
接近最高的选点概率增加(这个应该是常识吧)
3. Master只用了一个GPU(!)
4. 关于不依赖人类棋谱训练的工作,暂时无可奉告
youtube的视频只有半个小时,并没有提到上面那四点,可能实在Q&A环节说的。
1. adversarial learning现在在图像生成和识别里面很火,也有用在自然语言处理里
面的。图像识别里面就是设置一个generator和一个discriminator,分别训练它们生成
尽可能真实的图像,和区分真实图像和generator生成的图像。对generator来说
discriminator就是一个目标函数,对discriminator来说generator探索真实图像以外
的空间中可能被discriminator误判为真是图像的样本,帮助discriminator更好的区别
真假图像。这里用在AG里的目标类似第二种。
2. 这个温度是指策略网络输出层也就是softmax层的一个参数,网络对每个选点给出一
个跟选点概率相关的数x_i, 然后分别计算exp(x_i/T), 归一化后得到最后的选点概率
。这里T就是温度,T越大不同选点的概率差异越小,这是一个受热力学启发的概念。这
点说明差不多质量的开局比人预想的要多。
3. 测试会比训练用的资源少,但只用1个GPU如果是真的只能说牛逼大发了。。
4. 也许开局变化多也跟没用人类棋谱bootstrap策略网络有关,如果是这样那第二点的
回答其实是避重就轻,因为调温度也是很老的技巧了。我才这点应该是真的,不过
Demis要留个悬念。。
标 题: Master只用了一个GPU
发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
的意思吧)
2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
接近最高的选点概率增加(这个应该是常识吧)
3. Master只用了一个GPU(!)
4. 关于不依赖人类棋谱训练的工作,暂时无可奉告
youtube的视频只有半个小时,并没有提到上面那四点,可能实在Q&A环节说的。
1. adversarial learning现在在图像生成和识别里面很火,也有用在自然语言处理里
面的。图像识别里面就是设置一个generator和一个discriminator,分别训练它们生成
尽可能真实的图像,和区分真实图像和generator生成的图像。对generator来说
discriminator就是一个目标函数,对discriminator来说generator探索真实图像以外
的空间中可能被discriminator误判为真是图像的样本,帮助discriminator更好的区别
真假图像。这里用在AG里的目标类似第二种。
2. 这个温度是指策略网络输出层也就是softmax层的一个参数,网络对每个选点给出一
个跟选点概率相关的数x_i, 然后分别计算exp(x_i/T), 归一化后得到最后的选点概率
。这里T就是温度,T越大不同选点的概率差异越小,这是一个受热力学启发的概念。这
点说明差不多质量的开局比人预想的要多。
3. 测试会比训练用的资源少,但只用1个GPU如果是真的只能说牛逼大发了。。
4. 也许开局变化多也跟没用人类棋谱bootstrap策略网络有关,如果是这样那第二点的
回答其实是避重就轻,因为调温度也是很老的技巧了。我才这点应该是真的,不过
Demis要留个悬念。。
f*g
4 楼
日,最后那句接下去得让泥男来写。
笑。
【在 s*****w 的大作中提到】
: 会做饭菜的男主,不多见啊。
: ====================================================
: 厨房中已经放了整套厨具,柜中满是食材。夜瞳看着两眼放光,就连千夜也忍不住想要
: 显一显身手了。
: 此刻已是晩饭时间,夜瞳即道:“我来做饭吧!”
: “一起。”千夜微笑道。
: 两人换下战斗服,一起动手下厨,一边讲些各自生活中的有趣事,时时会开怀大笑。
: 千夜在旁看了,不禁失笑,从夜瞳手中接过菜刀,随手拿起一块鱼段。在千夜手中
: ,菜刀忽如有了灵性,绕着鱼身上下飞舞,片片薄如纸片的鱼肉就如雪片纷落,堆在盘
: 中。到得最后,千夜手上就只剩一根光溜溜的鱼刺。
笑。
【在 s*****w 的大作中提到】
: 会做饭菜的男主,不多见啊。
: ====================================================
: 厨房中已经放了整套厨具,柜中满是食材。夜瞳看着两眼放光,就连千夜也忍不住想要
: 显一显身手了。
: 此刻已是晩饭时间,夜瞳即道:“我来做饭吧!”
: “一起。”千夜微笑道。
: 两人换下战斗服,一起动手下厨,一边讲些各自生活中的有趣事,时时会开怀大笑。
: 千夜在旁看了,不禁失笑,从夜瞳手中接过菜刀,随手拿起一块鱼段。在千夜手中
: ,菜刀忽如有了灵性,绕着鱼身上下飞舞,片片薄如纸片的鱼肉就如雪片纷落,堆在盘
: 中。到得最后,千夜手上就只剩一根光溜溜的鱼刺。
n*7
5 楼
具体不懂
不过如果能在大规模cluster上training
然后单机运行model的话
这很nb啊
这样的架构可以让未来每个手机,每部车都集成一个强大的AI
不过如果能在大规模cluster上training
然后单机运行model的话
这很nb啊
这样的架构可以让未来每个手机,每部车都集成一个强大的AI
G*s
8 楼
烟男越来越装了
笑。
【在 s*****w 的大作中提到】
: 会做饭菜的男主,不多见啊。
: ====================================================
: 厨房中已经放了整套厨具,柜中满是食材。夜瞳看着两眼放光,就连千夜也忍不住想要
: 显一显身手了。
: 此刻已是晩饭时间,夜瞳即道:“我来做饭吧!”
: “一起。”千夜微笑道。
: 两人换下战斗服,一起动手下厨,一边讲些各自生活中的有趣事,时时会开怀大笑。
: 千夜在旁看了,不禁失笑,从夜瞳手中接过菜刀,随手拿起一块鱼段。在千夜手中
: ,菜刀忽如有了灵性,绕着鱼身上下飞舞,片片薄如纸片的鱼肉就如雪片纷落,堆在盘
: 中。到得最后,千夜手上就只剩一根光溜溜的鱼刺。
笑。
【在 s*****w 的大作中提到】
: 会做饭菜的男主,不多见啊。
: ====================================================
: 厨房中已经放了整套厨具,柜中满是食材。夜瞳看着两眼放光,就连千夜也忍不住想要
: 显一显身手了。
: 此刻已是晩饭时间,夜瞳即道:“我来做饭吧!”
: “一起。”千夜微笑道。
: 两人换下战斗服,一起动手下厨,一边讲些各自生活中的有趣事,时时会开怀大笑。
: 千夜在旁看了,不禁失笑,从夜瞳手中接过菜刀,随手拿起一块鱼段。在千夜手中
: ,菜刀忽如有了灵性,绕着鱼身上下飞舞,片片薄如纸片的鱼肉就如雪片纷落,堆在盘
: 中。到得最后,千夜手上就只剩一根光溜溜的鱼刺。
C*5
9 楼
我得好好看看这文章。NVDA要哭倒在厕所里的意思吗?
【在 a*****g 的大作中提到】
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
: 的意思吧)
: 2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
: 接近最高的选点概率增加(这个应该是常识吧)
: 3. Master只用了一个GPU(!)
【在 a*****g 的大作中提到】
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
: 的意思吧)
: 2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
: 接近最高的选点概率增加(这个应该是常识吧)
: 3. Master只用了一个GPU(!)
z*8
14 楼
亚麻的AWS就这么收费的 你花钱训练一个模型 然后丢到一个便宜的EC2上运行。。。
i*q
15 楼
2.temperature 搞在policy net?
不同的temperature 搞一堆不同的player 然后self-play 生成data 训练value net?
一个GPU不奇怪吧 如果是训练好的网络只做forward inference.
【在 a*****g 的大作中提到】
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
: 的意思吧)
: 2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
: 接近最高的选点概率增加(这个应该是常识吧)
: 3. Master只用了一个GPU(!)
不同的temperature 搞一堆不同的player 然后self-play 生成data 训练value net?
一个GPU不奇怪吧 如果是训练好的网络只做forward inference.
【在 a*****g 的大作中提到】
: 发信人: nightwizard (JK), 信区: Weiqi
: 标 题: Master只用了一个GPU
: 发信站: 水木社区 (Sun Mar 26 23:19:17 2017), 转信
: http://www.lifein19x19.com/viewtopic.php?p=217809#p217809
: 1. 好像用到了adversarial learning的思想,让一个anti-AlphaGo找出AlphaGo未考虑
: 到的选点,以减少漏算、避免过拟合(应该就是整天自我对局,容易不知如何应对新招
: 的意思吧)
: 2. 如果要增加开局变化,可调整一个“温度”参数,温度越高则选择评分不是最高但
: 接近最高的选点概率增加(这个应该是常识吧)
: 3. Master只用了一个GPU(!)
相关阅读
Seeking Quant/Software Developers (转载)programcreek这个网站好像是个国人弄的科学就是重复很简单的东西求推荐gpu 个人爱好家用stackoverflow上很多自恋狂能刷题的才叫计算机语言研究一下云部署方案黄秋园老师有这等交际实力,混苦逼的学术圈太可惜了 (转载)Remote Development with VS Code还记得之前我有几个贴推论AI走向超现实吗?Re: 觉得FB尹伊非常不简单 (转载)都有谁需要WSE证书评估?[bssd] Election Fraud is part of American Heritage现在的编程考试都这样吗? (转载)Re: 进不进藤校确实无所谓 (转载)黄秋原这个八卦怎么回事?魏老师要开源吗小菊花,做人不能不说人话不干人事儿docker 和 serverless,哪个搭网站更好?ML 大牛。。。去除这种“噪音警报”容易吧?