Redian新闻
>
13层网络如何拿下83%精度?极简神经网络架构VanillaNet作者亲自解读

13层网络如何拿下83%精度?极简神经网络架构VanillaNet作者亲自解读

公众号新闻


过去几十年里,人工神经网络取得了显著的进展,这归功于一种理念:增加网络的复杂度可以提高性能。

从 AlexNet 引爆了深度学习在计算机视觉的热潮后,研究者们为了提升深度网络的性能,精心地设计出了各种各样的模块,包括 ResNet 中的残差,ViT 中的注意力机制等。然而,从 ResNet 到 ViT 以来,尽管深层的复杂神经网络可以取得很好的性能,但在实际应用中,这些网络的复杂度和硬件亲和程度使其部署时常常会遇到困难。

因此,来自华为诺亚、悉尼大学的研究者们设计了一种极简的神经网络模型 VanillaNet,期望用最简单的,类似 LeNet 和 AlexNet 这样的结构,达到甚至超越现在网络的精度,成为新一代的视觉骨干网络。

本工作的核心是如何让一个浅层网络在没有复杂链接和 attention 的情况下,尽可能地提升精度,针对极简网络面临的非线性大幅下降的技术难题,本工作提出了深层训练和级数激活函数两个方案来解决此问题。最终,6 层的 VanillaNet 可以超过 ResNet-34,13 层的 VanillaNet 在 ImageNet 可以达到 83% 的 top1 精度,超过几百层网络的性能,并展现了非凡的硬件效率优势。

为了更好的帮助大家了解这项研究,机器之心最新一期线上分享邀请到了论文作者之一陈汉亭,为大家解读他们近期的工作 VanillaNet。


分享主题:VanillaNet:深度学习中极简主义的力量

嘉宾简介:陈汉亭,华为诺亚方舟实验室研究员,主要研究方向为深度学习和计算机视觉。他在 NeurIPS/CVPR/TPAMI 等顶会顶刊发表 20 余篇论文,多项研究成果应用于华为产品。他的谷歌学术引用 2000+,其中加法网络、IPT 等工作受到广泛关注。

分享摘要:华为诺亚实验室的研究员提出了一种极简网络架构 VanillaNet,不含残差链接,自注意力等复杂的模块,却可以在计算机视觉任务上取得惊人的性能。在 ImageNet 图像识别任务上,13 层的 VanillaNet 在 ImageNet 可以达到 83% 的 top1 精度,速度超过同精度的 Swin Transformer 两倍以上。

相关链接:

  • 论文链接:https://arxiv.org/abs/2305.12972

直播间:关注机动组视频号,立即预约直播。


交流群:本次直播有 QA 环节,欢迎加入本次直播交流群探讨交流。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
香港理工大学林婉瑜博士实验室招收可信人工智能/图神经网络方向全奖博士生/博士后只要你用ReLU,就是“浅度学习”:任意ReLU神经网络都有等效3层网络Nat. Commun. | 浙江大学郭国骥/韩晓平/王晶晶团队基于单细胞图谱和人工智能神经网络的基因组变异解码框架天父的花园里[打卡] 什么是AI 的“神经网络”?23层俯瞰NEU校园 | 高级公寓设施只有你想不到 | 多种房型人均低至$1838华为诺亚提出VanillaNet:一种新视觉Backbone,极简且强大!多层网关已成过去,网关多合一成潮流,网关改造正当时|Higress 1.0 正式发布液态神经网络无人机在未知领域航行时击败了其他人工智能系统Bioinformatics | 来鲁华/邓明华合作:多层级的图神经网络促进蛋白质功能预测Npj Comput. Mater.: DFT中的电子密度—等变图神经网络𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~昨天,女儿把我气疯了【吃顆米大會(つっこみたいかい)】暖場《ふるさとはどこですか故鄉在何處》(小村之戀)CVPR 2023 | 神经网络超体?新国立LV lab提出全新网络克隆技术「拖拽」就能实现精准P图的DragGAN,论文作者亲自揭秘技术了AI「心灵之眼」被看透!大改神经网络,模型生成背后逻辑首现小学成绩极具欺骗性,哪些孩子容易掉队?别猜啦,我请来北京四中校长亲自解读我们能向黑人学什么【𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶无痕内裤】49元三条!巨巨巨好穿 !!简直就是辣妹顶配,食品级冰箱收纳盒【一日团】GPT的背后,从命运多舛到颠覆世界,人工神经网络的跌宕80年突破神经网络限制,量子蒙特卡洛研究新进展登Nature子刊CVPR 2023 | 三维场景生成:无需任何神经网络训练,从单个样例生成多样结果Sam Altman中国对话全文:要警惕AI风险,但看懂神经网络比了解人在想什么容易多了【最新】网络创作者主要是哪类群体?当下面临哪些主要问题?《2022年网络视听内容创作者白皮书》发布→北京线下丨鼎石、十一学校、UWC毕业生分享,最难申请季如何拿下英美名校?中国学者引领图神经网络技术的重要突破,再次刷新了蛋白质性能预测榜单记录《红叶恋歌》&《飞云之下》类GPT模型训练提速26.5%,清华朱军等人用INT4算法加速神经网络训练ChatGPT时代的开源解法,「白泽」一作亲自解读SpikeGPT项目原作解读:使用脉冲神经网络的生成式语言模型智能汽车芯片酣战,如何拿下主流市场?搭建神经调控及介入式脑机接口两大平台型产品,哈佛博士如何拿到上亿元融资?家里太小、东西堆成山?极简收纳这样做,让你家变大20㎡13层网络拿下83%精度,华为诺亚新型神经网络架构VanillaNet「简约」到极致
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。