Redian新闻
>
随机种子 3407 is all you need

随机种子 3407 is all you need

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 夕小瑶的卖萌屋
文 | 天于刀刀

你最常用的随机种子是哪个?

在刀刀的团队里,关于随机种子的设置主要分化为两派~

玄学派,可能设置为自己的纪念日,又或者是星座预测中的本月幸运数字;

以及,自然派,随机种子是啥其实无所谓,1234或者今天的日期都可以。

深度学习知名学者 ChatGPT 也如下所说:

可是近日我看到了一篇叫做《Torch.manual_seed(3407) is all you need》[1] 的论文,当时看到这个标题的时候我简直眼前一黑。

这篇论文研究了随机种子在深度学习用于计算机视觉时对精度的影响。作者对 CIFAR 10 和 ImageNet 两个数据集进行了实验,结果发现即使方差不是很大,还是很容易找到一个比平均值更好或更差的种子。

如图所示,作者在 CIFAR10 上对500个不同的种子进行训练,其中黑线是平均值,暗红色表示标准差,浅红色表示最小值和最大值区间。

可以看到,经过 epoch 25 后,精度几乎没有增加,这意味着模型收敛了。但是浅红色的区间范围没有得到减少,意味着随着模型收敛,随机种子的不同依旧会造成最大值和最小值之间巨大的差别。

同时作者还在文中分析道:由于都是基于同一个预训练模型,因此随机种子的效果只和分类层的初始化以及后续的优化过程有关。

让我们先抛开作者在文中申明的 limitation 不谈,他的这篇文章行文结构还挺像模像样的。

(在这里我指的是抛开他只进行了少量训练,且模型最终的结果完全落后于 SOTA 的事实不谈,单独只看他发文章的科研思想)

也就是说,随机种子的选择对结果的影响很大?

虽说觉得有点不靠谱,但事不宜迟,我速速打开了算力平台,新开启了一个训练任务,设置 seed 为3407之后跑了起来。

结果竟然直接 early stop 了!

当我兴致勃勃地打开训练报告时,结果发现关键指标几乎没什么变化,也根本没有发现作者所说的“模型效果获得较大提升”的现象。

结合其缩减了大约 50% 的训练时间的效果(只做了一次实验,无统计学意义),只能说改变随机种子不是完全没作用,但这作用着实不多。

这篇论文让我感到很疑惑,难道我们真的需要研究随机种子的影响吗?

在我的理解中,随机种子的作用主要是为了保证在多次实验中可以重现结果,而不是对结果产生显著影响。

我甚至认为作者是一个行为艺术者,他在嘲讽目前学术界刷论文、比赛刷榜中频频出现的过拟合乱象。

有许多研究者花费了大量的时间精力和算力去撞随机种子,故意过拟合测试集以此来得到 sota 结果,这种行为不能说是毫无意义,只能讲是步入歧途。

作为一名炼丹师,对于随机种子的修改只能是一种缺乏统计学基础知识的表现。

可是转念一想,作为一名算法工程师在工作中总会遇到无论如何绞尽脑汁也难以提分的情况。

在时间紧迫来不及清洗数据、添加数据以及干一些脏活的情况下,面对可解释性极差的 AI 魔法,也许我们选择更改随机种子的时候,心里更多想的是需要一个新的“运气”。

说不定,说不定这样就能提一点点分能让我交差了呢?

作为一名学生,也许我能获得宽裕的时间和资源去支持我按期完成学术研究;

可作为一名员工,也许我在大多数时候只能利用有限的资源去追赶去补完老板口中那个无限的大饼。

“人类是存在极限的”,有的时候并不是我不知道这样没用,但我又能有什么办法呢?

换一个 seed 吧,这就是我最后的波纹了。

# 计算天干地支获取随机幸运种子 [2]
$ pip install randluck
$ python
>>> import randluck
>>> random_seed = randluck.get_random_seed(strategy='bazi')

技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Young Chinese Are Overdosing on Cough Meds to Combat StressiPhone 15 传增添三种新色 Pro机种特别色是这个气候变化 | IEEE 2023主席Saifur Rahman和IEEE代表团出席COP27【无忧买房】Needham独栋别墅出售,高评分学区,近I-95高速和Needham镇中心【Green House】【Berklee/NEU/NEC/BU】四月到十月排位开启办公室软装、疫情talk、Deadline、校友会 | One Week In BeBeyondChinese Netizens Ask: Should Boys be Allowed in Women-Only Areas[干货] Have you eaten 和 Did you eat 的区别?【Greenhouse 2023排位+现房】【NEU/NEC/Berklee】【8/9月入住的官方排位会在2月结束】We Need you!南航洛杉矶营业部招聘换工记,在911呼叫中心工作ChatGPT is not all you need,一文综述6大公司9类生成式AI模型德国指挥家的中国妻子Court Favors Teens Who Sued Father for Red Envelope Money【Greenhouse排位全解】【暑期/秋季】【轻松入住】【本科生性价比之最】【NEU/NEC/Berklee】【$3400起】YOLOv8来啦 | 详细解读YOLOv8的改进模块!YOLOv5官方出品YOLOv8,必卷!How Hangzhou Freed West Lake and Upended Chinese TourismI'm all about you什么意思呢?意思令人感动!For Young Chinese Seeking Jobs, Less Pay Means More Life Balance日投降后毛泽东赴重庆国共谈判Recovered From COVID, Young Chinese Gripped by Snow Fever奇特的病人案例An invitation to fluorescent party for only returnees like you!【Green House】【Berklee/NEU/NEC/BU】六月到九月排位进行中限时领 | 美国学霸超级笔记《everything you need to ace》,让你零距离接触学霸的头脑思维风暴!微软亚研院:Language Is Not All You NeedA Day in a Shanghai Park: See You Next Wednesday【友情转发】【Start Your UIUX Journey】开启你的UIUX旅程!精选Quant岗位 | Millennium、New York Life Insurance、PenFed发布最新岗位!投稿延期 | IEEE ICC 2023(IEEE国际通信会议)[语法] Where did you visit? 还是 Which places did you visit?#英语学习#英语俗语:Keep you on your toesOut with the old, in with the new. JuniorCoach is here for youYou're handsome和You look handsome竟然有这个区别!美国婚前财产、婚后财产及个人财产的认定
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。