Redian新闻
>
谷歌大脑深度学习调参(炼丹)指南出炉,Hinton点赞,一天收获1500星

谷歌大脑深度学习调参(炼丹)指南出炉,Hinton点赞,一天收获1500星

公众号新闻
机器之心报道
机器之心编辑部
「大量的实践经验已被提炼成这份强大的深度学习模型调参指南。」——Geoffrey Hinton。

众所周知,AI 的超参数决定着模型学习效果和速度。相比普通机器学习任务,深度学习需要的训练时间较长,因此调参技巧就显得尤为重要。


但鉴于深度学习「炼丹」的特性,不同的模型需要不同的超参数,而每个超参的意义又不同,在不同实验中,参数和调整的方向又都不一样。调参这件事一直以来没有固定的套路,每个人都有自己的经验,因此经常会出现一些似是而非的理论,比如:


  • Random seed = 0 得到坏的结果

  • Random seed = 42 得到好的结果


为了破除「迷信」,高举科学旗帜,近日来自谷歌大脑、哈佛大学的研究人员发布了《Deep Learning Tuning Playbook》,旨在帮助大家解决这一 AI 领域的老大难问题。


项目 GitHub 上线仅一天就已收获了上千 Star 量:


项目地址:https://github.com/google-research/tuning_playbook


该项目也得到了图灵奖获得者,谷歌 AI 科学家 Geoffrey Hinton 等人的转推支持。Geoffrey Hinton 表示「大量的实践经验已被提炼成这份强大的深度学习模型调参指南。」



文档意义


这份调参指南适用于对改进深度学习模型性能感兴趣的工程师和研究人员。阅读这份指南需要掌握机器学习和深度学习的基本知识。


这份指南的主要内容是调整超参数,也涉及深度学习训练的其他方面,例如 pipeline 实现和优化。指南假设机器学习问题是一个监督学习问题或自监督学习问题,但其中的一些规定也适用于其他类型的问题。


当前,深度神经网络就像一个黑箱,要想在实践中获得良好的性能,需要付出大量的努力和猜测。更糟糕的是,很少有人记录各种研究获得良好结果的实际方法。人们似乎在回避详解实践中的调参问题,也极少分享经验。这让深度学习专家获得的实验结果,与普通从业者复现相似方法获得的结果差距悬殊。


随着深度学习方法的成熟并对世界产生重要影响,深度学习社区需要更多涵盖有用方法的资源,包括对于获得良好结果至关重要的所有实用细节。


本项目是一个由五名研究人员和工程师组成的团队,他们在深度学习领域工作多年,其中一些人早在 2006 年就开始了。


该团队已经将深度学习应用于从语音识别到天文学的各个领域的问题,并在此过程中学到了很多东西。本文档源于工程师们训练神经网络、教授新机器学习工程师以及为同事提供深度学习实践建议的经验。虽然深度学习早已从实验室实践的机器学习方法发展为数十亿人使用的技术驱动产品,但它作为一门工程学科仍处于起步阶段。


该指南是谷歌研究人员在构建自有深度学习方法时产生的,它代表了作者在撰写本文时的观点,而不是任何客观规律。为此,作者鼓励发现其中存在问题的读者提出替代建议和令人信服的证据,以便不断更新完善这份指南。


需要说明的是,这不是 TensorFlow 等谷歌产品的官方支持文档。


指南内容


该指南包含哪些内容?可以分为四大部分:


  • 指导开始新项目

  • 改善模型性能的科学方法

  • 如何决定每次训练运行步数

  • 训练过程中的其他经验


例如第一部分,你开始新项目时如何选择模型架构、优化器、batch 大小等,都有详细的经验指导。


该指南中关于选择模型架构的经验。

而后关于「炼丹」的模型性能改进、训练运行的步数等也有经验分享。

可以说,这份指南可以教你提升模型性能的大量细节。看完下面目录,大家可以去Github细致学习下。




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
谷歌推出深度学习调优手册,不到一天狂揽1200星,Hinton转发|GitHub超越CLIP!谷歌大脑多模态学习新作CLIPPO:仅从像素理解图像和语言「深度学习+」阶段来了!百度王海峰:深度学习多维度逐渐成熟,创新创造大有可为涨点神器!超越Adam!谷歌提出Lion炼丹优化器,内存更小、效率更高!深度学习先驱者 Geoffrey Hinton 发布新深度学习算法【财闻联播】旅游书用靖国神社作封面,出版社紧急回应!清华博士送外卖?百万网友点赞,当事人这样说超参数科技招聘:强化学习研究员、深度学习工程师、后台开发工程师等国际合作中心副主任常皓带队赴中国航天科工二院开展学习调研西方热钱涌入中国杨振宁对杜家的贡献天赋“易昺(bǐng)”,创造历史!第二次徒步圣路,750公里葡萄牙之路+英国之路:D04~孤身上路2023炼丹GPU选购指南来了!英伟达3080和4070Ti成性价比之王!速揽2500星,Andrej Karpathy重写了一份minGPT库白天打工,晚上科研,谷歌大脑研究科学家破解了困扰数学界几十年的猜想重磅出炉,2023THE全球国际化大学排名出炉,香港大学领跑世界第一,CV发论文的机会来了!南洋理工项目招生(仅限深度学习,AI,机器学习,迁移学习方向)Transformer模仿大脑,在预测大脑成像上超越42个模型,还能够模拟感官与大脑之间的传输深度学习GPU选购指南:哪款显卡配得上我的炼丹炉?人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史何时起,“骰子”不读shǎi,改读tóu了?梳理机器学习常用算法(含深度学习)福建“最狠车主”事件:半夜把别人车扔进河,全网点赞,他却后悔了……【乐游】樱花季、马王堆、名家月……本周文旅生活指南出炉→病中草福建“最狠车主”事件:半夜把别人车扔进河,全网点赞,他却后悔了…如何提升深度学习算法效率,谷歌有这些绝招重磅!谷歌发布《深度学习调优手册》!Hinton转发点赞!人才招聘 | 深度学习研究员-北/上/深/杭-80~200w+深度学习GPU选购指南Mesa Verde 国家公园看古印第安人岩居 - 多彩科州之旅(九)最强 AI 对话系统 ChatGPT横空出世!马斯克点赞,用户破百万!只能点赞,不能点“踩”,微信朋友圈为何这样做?央视点赞,火到国外,《狂飙》里的这个细节,细思极恐积木式深度学习的正确玩法!新加坡国立大学发布全新迁移学习范式DeRy,把知识迁移玩成活字印刷|NeurIPS 2022
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。