Redian新闻
>
促进低精度数字格式使用,Graphcore发布全新Unit Scaling库

促进低精度数字格式使用,Graphcore发布全新Unit Scaling库

公众号新闻

Unit Scaling是一种模型设计方法,能够让FP16和FP8等低精度数字格式更加易用。我们很高兴地宣布,我们发布了一个PyTorch库来促进Unit Scaling的使用。 


7月,Graphcore(拟未)在ICML上发表了论文《Unit Scaling:开箱即用的低精度训练》[1]。现在,我们发布软件工具,让更多人可以使用这种方法。


支持FP8的硬件的发展大幅提高了用户效率,例如Graphcore® C600 IPU处理器PCIe卡[2]。但是,简单地将较高精度的值转换为FP8值往往会导致性能降低。Unit Scaling解决了这一问题,为充分利用FP8硬件进行训练提供了一条简单的路径。


查看库文档[3]

阅读我们的ICML论文[4]


库操作演示




为了向用户展示如何在他们自己的模型中应用Unit Scaling,我们还发布了一个和库配套的notebook。它展示了在FP8下,使用和不使用Unit Scaling的nanoGPT模型训练。


https://ipu.dev/a2FqG0


只需一行代码——model = unit_scale(model)——用户就可以将他们的PyTorch模块转化为单位缩放模型。我们在notebook中通过训练以下模型说明了这一点:




在FP8中直接训练基础模型会导致明显的性能下降。不过,使用Unit Scaling可以恢复全精度。


这种单行转换可应用于任意PyTorch模型,与torch.compile[5]一起使用时,开销可忽略不计。


实施Unit Scaling




单行自动unit_scale()转换是一项实验性功能。我们建议大多数用户通过以下方式手动实施Unit Scaling。


您可以考虑这种导入PyTorch模块/函数的常见方法:



在此设置中,您可以这样实现Unit Scaling,首先添加:



然后将字母nn替换为uu,将F替换为U,让这样这些类和函数变成单位缩放的。例如:



我们的用户指南[6]中还介绍了运用Unit Scaling所需的一些其他注意事项。用户应特别注意正确缩放跳转/残差增量和损失函数。


使用库




Unit Scaling可通过以下方式安装:



尽管我们付出了诸多努力,但unit_scaling毕竟是一个新的库,我们不能保证它完全没有bug或功能已经完全齐备。不过我们将非常愿意为这个库的使用者提供帮助。


您可以通过我们的Slack频道[7]联系我们的开发者社区或提出GitHub问题[8]


[1]https://arxiv.org/abs/2303.11257

[2]https://www.graphcore.cn/c600-pcie%E5%8D%A1/

[3]https://github.com/graphcore-research/unit-scaling

[4]https://arxiv.org/abs/2303.11257

[5]https://pytorch.org/tutorials/intermediate/torch_compile_tutorial.html

[6]https://graphcore-research.github.io/unit-scaling/user_guide

[7]https://www.graphcore.ai/join-community

[8]https://github.com/graphcore-research/unit-scaling





获取更多Graphcore资讯,阅读深度技术文章,并与其他创新者们一起交流,请至中国官网graphcore.cn,以及关注Graphcore微信、微博和知乎创新社区。

Graphcore中国官网

Graphcore官方微信

Graphcore微博创新社区

Graphcore知乎创新社区

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“Let's agree to disagree” 到底要不要同意? | 1 min learning English你好,我是筚(bì)篥( lì)!How Residents Are Rebuilding Shanghai’s Urban CommunitiesCogX Festival开幕在即,Graphcore入围CogX Awards两大奖项故国2023,闺蜜游长安Telegraph发布全球中学获牛剑offers排行榜厂二代扎进低代码长篇小说《如絮》第一百四十二章 哈尔滨 夜审妙鸭相机免费版发布;蔚来手机NIOPhone发布;比亚迪首款百万级产品仰望U8正式上市……𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~Bengio团队Nature发文:四个维度讲AI for Science,还讨论了AI跨界核心挑战病毒羔羊第九章 媽媽來了GACS 2023 | Graphcore现场解读IPU的独特架构如何助力AI大时代Graphcore专区已在飞桨AI Studio上线双林奇案录第三部之川黔连环案: 第三十四节Graphcore AI工具生态系统再扩展,UbiOps增加IPU支持With Jobs Scarce, Young Chinese Are Becoming ‘Full-Time Kids’11月必看!“新世界三大男高音”Juan Diego Flórez首次亮相澳洲!PyTorch 基金会又添新成员!Graphcore 官宣加入,推动 AI 研究和应用突破台积电被美国工会炮轰 否认找借口引进低薪劳工天天吃鱼Sungiven Greystone Store 盛裝開業星战全新UCS套装狩猎者级歼星舰正式登场Graphcore支持Byte MLPerf,为AI生产部署提供性能基准参考Half of China’s Gig Work Seekers Have Undergrad Degrees: ReportTroubled Singing Reality Show Accused of Mistreating Coco Lee西湖大学刘晓东教授研究成果再登Nature:通过“格式化”细胞记忆,获得超能iPSCs!How Guangdong Pioneered Chinese Photography在Graphcore IPU上高效部署Meta开源Llama 2在Graphcore IPU上运行JuliaGraphcore加入PyTorch基金会Agency Demands Photographer Pay — For Using Own PhotosGraphcore携手Pienso荣获CogX最佳创新类别的自然语言处理奖AIGC日报丨英伟达挑战者 Graphcore 需融资求生;三星已拥有近 3 亿 SmartThings 智能家居用户Nature发文称 LK99 不是室温超导体 / iPhone15 系列或将减产 / B站用户日均使用时长创新高
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。