Redian新闻
>
英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM

英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM

公众号新闻
Pine 发自 凹非寺
量子位 | 公众号 QbitAI

“AI的iPhone时刻已至”,英伟达或成最大赢家。

在GTC2023大会上,黄仁勋接连放出大招:

不仅发布了ChatGPT专用GPU,比之前就能实时处理ChatGPT的HGX A100快了10倍

还公布了其在芯片领域的进展,推出了新的cuLitho软件库,使光刻计算速度整体提高了40倍

从老黄的言语中也能得知,当下各种爆红的AIGC产品:ChatGPT、Stable Diffusion、DALL-E等都能见到英伟达的身影。

而去年年末至今,ChatGPT爆火,也顺势拉动了英伟达的股价,年初至今就上涨83%。

目前,英伟达的市值为6471亿美元。

会上及会后采访中,老黄的言语之中也是透露着对AI生成内容的褒奖:

AI是用人类语言编程的新型计算机,未来每个人都将是程序员。

话不多说,会上具体都有哪些亮点,一起盘点下~

发布ChatGPT专用GPU

会前,网友们对GTC的猜测都集中在ChatGPT上。

而英伟达,也是毫不吝啬,不止ChatGPT,AIGC方面直接一把推出了四种针对AI任务的推理平台:

  • L4 Tensor Core GPU

  • L40 GPU

  • H100 NVL GPU

  • Grace Hopper超级芯片

其中,H100 NVL GPU是英伟达这次推出的ChatGPT的专用GPU,它是基于去年已经发布的H100的改进版本:配备双GPU NVLink,将两张拥有94GB HBM3显存的PCIe H100 GPU拼接在一起。

性能的话,老黄形象地做了个对比:

相较于目前唯一可以实时处理ChatGPT的HGX A100,一台搭载四对H100和双NVLINK的标准服务器能将速度提升10倍,并且还可以将大语言模型的处理成本降低一个数量级。

期间,老黄还展示了自己亲自把首款签名版DGX交付给OpenAI的画面。

然后再来说下其他三个推理平台:

L4是专门针对AI生成视频设计的一款通用GPU,它提供的视频性能比CPU高出整整120倍,能效提高了99%。

L40则是用在图像生成上的GPU,它能对AI生成2D、3D图像进行优化,相较于英伟达的云推理GPU T4,性能提升了10倍。

Grace Hopper超级芯片用在推荐系统和大型语言模型AI数据库上,图推荐模型、向量数据库和图神经网络都可以选择这款芯片。

更具体一点,通过900GB/s高速芯片对芯片的接口,Grace Hopper超级芯片可连接Grace GPU和Hopper GPU,而Grace和Hopper正是处理大型语言数据集的理想选择。

到这里,你以为关于ChatGPT的相关产品就没了?

大NO特NO。

在ChatGPT这块儿,英伟达还致力于下沉市场,联合微软Azure、Google GCP和Oracle OCI三家云厂商合作推出了DGX Cloud。

普通企业也能训练LLM。

也就是说,想要训练像ChatGPT的大语言模型,可以直接在网络上租赁DGX云服务,这样一来客户就能将英伟达DGX AI超级计算机实时接入公司。

英伟达提供的DGX服务器,包含8个H100或A100图形处理器和640GB内存,A100层的价格为每月36999美元。

而直接购买一个实体DGX服务器,就要花费20万美元,并且微软当时为了训练新必应也是斥资数亿美元购买了数万块A100芯片。

用cuLitho加速芯片创新

ChatGPT等一众AIGC产品毫无疑问已经成为当前的AI圈的宠儿,不过在英伟达眼中ChatGPT只是一个起点。

GTC大会上,老黄放出了另一枚重磅级“核弹”,把加速计算引入到光刻领域——推出英伟达cuLitho计算光刻库

cuLitho计算光刻库是啥?

一言以蔽之,cuLitho是一个可以加速光刻基础计算的算法库,能够很大程度上提升光刻计算的速度,并且节省能耗。

老黄表示,目前计算光刻每年都需要消耗数百亿CPU时间。而运行在GPU上cuLitho,可以将目前光刻技术的性能提升40倍,功耗降低至此前的1/9。

甚至在某种程度上cuLitho还可以为行业2nm工艺奠定基础。

目前,英伟达已经与台积电、ASML和Synopsys等芯片厂商达成合作,后续芯片生产中,也会引入cuLitho这项AI技术。

其中,台积电CEO魏哲家称赞,cuLitho为台积电在芯片制造领域部署反向光刻技术和深度学习等光刻解决方案开辟了新的可能性。

老黄也在会上预告,台积电将在今年6月份的2nm芯片生产中引入cuLitho

ASML首席执行官Peter Wennink也做出计划,让所有的计算光刻软件产品都支持GPU,同时也表示与英伟达在GPU和cuLitho上的合作会给计算光刻带来巨大的好处。

Synopsys公司这边,在cuLitho平台上运行了Synopsys OPC软件,性能直接得到了从几周到几天的提升。

一些其他亮点

除了上面提到的这些,GTC大会上,英伟达还公布了一些其他合作项目:

比如说生成式AI方面有Adobe、Getty Images和Shutterstock。

医学方面,英伟达宣布了新的合作伙伴Medtronic,黄仁勋透露,目前正在一起构建一个医疗方面的AI平台,涵盖手术引导和机器人辅助手术。

……

如果还想了解更多关于GTC2023的内容,可以戳下面链接查看直播回放。

直播回放:
https://www.youtube.com/watch?v=DiGB5uAYKAg

参考链接
[1]
https://www.theverge.com/23649329/nvidia-dgx-cloud-microsoft-google-oracle-chatgpt-web-browser
[2]https://nvidianews.nvidia.com/news/nvidia-asml-tsmc-and-synopsys-set-foundation-for-next-generation-chip-manufacturing

3月29日「中国AIGC产业峰会」

抢票开启

「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!

百度袁佛玉、智源林咏华、澜舟科技周明、小冰徐元春、科大讯飞高建清、启元世界袁泉、云舶科技梅嵩、特赞王喆、微软关玮雅、源码资本黄云刚、元语智能朱雷、无界Ai马千里、Tiamat青柑、峰瑞资本陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。

扫描下方二维码,报名峰会线下会场啦~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
老黄手捧ChatGPT专用“核弹”炸场,英伟达H100至尊版速度提10倍!Btrfs性能得到优化,最高提升10倍ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报马克谈天下(358) AI作图谱曲贺新年英伟达发布ChatGPT专用GPU,计算光刻提速40倍!AI的决定性时刻来了性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻高通新骁龙7芯片或将到来,性能提升、谁将首发?集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布就地取材的年夜饭文心一言迭代数据曝光,QPS提升10倍,留给大模型创业玩家的涌现时间不多了每天少使用15分钟手机,可增强免疫、改善睡眠;让GPT-4自我反思:性能提升近30%,编程能力提升21%|本周值得读开源版ChatGPT,30分钟训完,性能堪比GPT3.5!老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版速度提10倍!苹果今晨推送新系统/ChatGPT出现泄露聊天记录的风险/英伟达ChatGPT同款超算上云腾讯加入 AI 大战,首发国内最强显卡,性能提升 3 倍当GPT-4反思自己错了:性能提升近30%,编程能力提升21%ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇ChatGPT 支持关闭聊天记录/ iOS 17或推出情绪追踪器/英伟达推出工具包以提升生成式 AI 可靠性英伟达杀入光刻领域,DPU和GPU重磅更新,首次详谈云服务!Vite 4.3正式发布,性能提升,为应对Rust写的Turbopack?高中教师养出40亿美元超级独角兽,Stable Diffusion背后数据集创建者,还发布ChatGPT最大平替LLM底座模型:LLaMA、Palm、GLM、BLOOM、GPT结构对比奥威尔在西班牙的奇幻冒险——Homage to Catalonia读后感All in AI!英伟达发布核弹级GPU,AI专用“这是AI的iPhone时刻”,芯片巨头发布ChatGPT专用GPU:速度快十倍!未来将与中国云服务商合作实现10倍应用性能提升的10个技巧港科大开源LMFlow!3090单卡5小时,每个人都能训练专属ChatGPT下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报字节参战!火山引擎推出大模型训练云平台,自研DPU实例性能提升3倍新年好3090单卡5小时,每个人都能训练专属ChatGPT,港科大开源LMFlow《触摸美国》的意义第四范式开源强化学习研究通用框架,支持单智能体、多智能体训练,还可训练自然语言任务!训练速度提升17%面向大模型训练,腾讯发布高性能计算集群:整体性能提升3倍
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。