Redian新闻
>
英伟达发布ChatGPT专用GPU,计算光刻提速40倍!AI的决定性时刻来了

英伟达发布ChatGPT专用GPU,计算光刻提速40倍!AI的决定性时刻来了

公众号新闻

就在昨晚,人工智能计算领域的领导者英伟达召开了2023 GTC大会黄仁勋先生在大会上围绕量子计算、芯片等前沿科技,发布了一系列前沿技术和产品,同时还分享了AI领域的最新进展及未来趋势。


图源GTC大会


“切勿错过AI的决定性时刻!”这是英伟达2023年GTC大会的宣传语。从上周三到现在,一系列AI技术相继发布,从OpenAI发布GPT-4,到百度发布文心一言,再到微软发布Office的AI助手Microsoft 365 Copilot,甚至在几小时前,谷歌也上线了Bard聊天机器人接受排队测试。


随着生成式AI掀起一波机遇浪潮,AI正处于关键时刻,海内外大厂都不甘居于人后。由于生成式 AI、多模态、大型语言模型需要处理复杂的数据和任务,涉及多个学科和领域的知识,需要不断突破计算和存储的限制,手握GPU算力技术的英伟达可算是“赢麻了”。


图源GTC大会


企业家全球考察团火热招募中>>

硅谷高创会汇聚全球创新资源,聚焦企业出海与引入落地,将组织企业家开展考察,促进优秀企业家、投资人、创业团队及政府代表与世界知名企业零距离接触,扩宽视野,寻觅合作,开拓市场。


考察团详细介绍及报名方式请点击蓝字链接查看:

1、全球创新领袖总裁香港(线下)硅谷(线上)行研学营火热招募中!参与亚洲最大春季电子展,实地走访名企,聚焦企业发展合作

2、报名开启!巴菲特股东大会VIP团,全球五万政商精英与股神面对面,限招席位!

3、硅谷高创会2023年企业家全球出海商务考察火热招募中!寻求海外订单和投资新机遇




一、ChatGPT专用GPU重磅发布


围绕生成式AI,英伟达发布了一系列加速模型训练和推理的软硬件新品及服务。“英伟达加速计算始于DGX(AI超级计算机),这是大型语言模型实现突破背后的引擎。”黄仁勋提到,“2016年我亲手将全球首款DGX交给了OpenAI,自此以后,《财富》100强企业中有一半安装了DGX AI超级计算机。DGX已成为AI领域的必备工具。”

今年GTC大会最惊艳的就是针对ChatGPT打造的NVIDIA H100 NVLINK。H100 NVLINK 是专门为LLM设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。相比于英伟达HGX A100,一台搭载四对H100和双GPU NVLINK的服务器速度还要快上10倍。因为H100可以将LLM的处理成本降低一个数量级。此外,H100 NVL配备94GB HBM3显存的PCIe H100 GPU,采用双GPU NVLink,支持商用PCIe服务器轻松扩展。

图源GTC大会


此外,黄教主还发布了针对其他不同工作负载可进行优化的推理平台配置——L4 Tensor Core GPU、L40 GPU、Grace Hopper超级芯片


图源GTC大会


针对AI视频工作负载,英伟达推出了L4,在视频解码和转码、视频内容审核、视频通话功能上做了优化,可以提供比CPU高120倍的性能,能效提升约99%。一台8-GPU L4服务器可以取代100多台用于处理AI视频的双插槽CPU服务器。目前,英伟达GPU在AI视频生产技术供应商Runway的产品中已经提供了相应的技术支持。


针对Omniverse、图形渲染以及文本转图像/视频等生成式AI,英伟达推出了L40。L40性能是英伟达最受欢迎的云推理GPU T4的10倍。Runway推出的Gen-1,以及Gen-2生成式AI模型拥有的强大能力便是借助了英伟达的GPU。


Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。


图源GTC大会



二、计算机光刻提速40倍


黄仁勋带来的另一项革命性技术是NVIDIA cuLitho的计算光刻库,NVIDIA cuLitho计算光刻库是英伟达联合晶圆制造巨头台积电、光刻机制造商ASML和EDA巨Synopsys,历时4年完成的,这不仅是一项聚焦先进芯片设计制造的技术,也关乎英伟达自身的产品研发。


在到达2nm制程的极限后,光刻就是突破点。NVIDIA cuLitho计算光刻库可以通过计算技术大幅优化芯片制造流程,利用GPU技术实现计算光刻,可以使传统光刻技术提速40倍以上,功耗可以降低9倍,为2nm及更先进芯片的生产提供助力。


图源GTC大会


据黄仁勋介绍,在芯片设计和制造领域中,计算光刻是最大的计算工作负载,每年都要消耗数百亿CPU小时。英伟达创造的这个新算法,可以让日益复杂的计算光刻工作流程能够在GPU上并行执行。此外,黄仁勋还表示,由于光刻技术已经处于物理学的极限,晶圆厂能够提高产量,为2nm及以后的发展做好准备。



三、量子计算


面向量子计算,英伟达与Quantum Machines合作推出了全球首个GPU加速量子计算系统NVIDIA DGX Quantum,将强大的加速计算平台(由NVIDIA Grace Hopper超级芯片和CUDA量子开源编程模型支持)与全球最先进的量子控制平台OPX结合在一起,使研究人员能够构建强大的应用,将量子计算与最先进的经典计算结合起来,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟,还能实现校准、控制、量子纠错和混合算法。NVIDIA DGX Quantum为从事量子计算的研究人员提供了一个革命性的高性能和低延迟的架构。


图源GTC大会


DGX Quantum还为开发人员配备了一款强大的混合GPU-Quantum编程模型NVIDIA CUDA Quantum,可以在一个系统中集成QPU、GPU、CPU并进行编程。多家量子硬件公司将CUDA Quantum集成到他们的平台中。



四、定制LLM和生成式AI


大会上,英伟达宣布推出NVIDIA AI Foundations云服务,让客户可以定制LLM和生成式AI。据黄仁勋介绍,NVIDIA AI Foundations是一个云服务和代工厂,用于构建自定义语言模型和生成式AI。该服务包括语言模型NEMO、视觉模型PICASSO和生物学模型BIONEMO。


图源GTC大会


NEMO是用于自然语言文本的生成式模型,可以提供80亿、430亿、5300亿参数的模型,且会定期更新额外的训练数据,可以帮助企业为客服、企业搜索、聊天机器人、市场分析等场景定制生产生成式AI模型。


图源GTC大会


PICASSO则是视觉语言模型制作,可以用于训练自定义模型,包括图像、视频和3D应用。只要向Picasso发送文本提示和元数据的API调用,Picasso就会用DGX Cloud上的模型把生成的素材发送回应用。值得一提的是,把这些素材导入NVIDIA Omniverse,就可以构建逼真的元宇宙应用,和数字孪生仿真。


BIONEMO是专门为用户提供创建、微调、提供自定义模型的平台,包括AlphaFold、ESMFold、OpenFold等蛋白质预测模型。生物圈的热门方向是利用生成式AI发现疾病靶因、设计新分子或蛋白类药物等。


图源英伟达官网



五、云服务:NVIDIA DGX Cloud


为了让客户更简单快捷访问NVIDIA AI,英伟达推出NVIDIA DGX Cloud。

Nvidia DGX Cloud将透过多个云端服务供应商提供,微软Azure预计于下一季起托管DGX Cloud服务,包括Google Cloud等业者也将陆续开始供应服务,DGX Cloud执行个体价格为每个执行个体每月36,999美金起。每个DGX Cloud执行个体皆有8个NVIDIA H100或NVIDIA A100 80GB Tensor GPU,单一节点具备640GB 的GPU记忆体,并透过NVIDIA Networking技术提供高效能、低延迟网路,使多个执行个体等同一个超大型GPU。


DGX Cloud将NVIDIA DGX强大的运算效能搬到云端平台,提供专用的NVIDIA DGX AI超算丛集,并同样可使用持续进化的NVIDIA AI软体;企业能够透过网路浏览器即可享有AI超级电脑的运算力,省却购置、部属与管理的复杂性。DGX Cloud包括NVIDIA AI平台软体层NVIDIA AI Enterprise提供端到端的AI框架与预训练模型,同时在此次的GTC大会也公布全新的NVIDIA AI Enterprise 3.1版本,带来全新预训练模型、最佳化的框架与加速资料科学软体库。


图源GTC大会



 结语

2023年以来,ChatGPT以摧枯拉朽之势,以期掀起第四次科技革命。在GTC大会上,黄仁勋将也将“我们正处于AI的iphone时刻”重复好几遍,很明显,生成式AI将几乎重塑所有行业。


从英伟达的发布会上,我们可以看到英伟达对先进AI计算的支撑已经覆盖了从GPU、DPU等硬件到帮助企业加速构建定制生成式AI模型的云服务。英伟达通过不断创新和技术升级,推动AI技术的发展,为各个行业和领域带来更多的机遇和挑战。

内容来源:https://www.nvidia.cn/

End

硅谷高创会企业家全球出海商务考察>>
2023年,硅谷高创会将在美国(硅谷、波士顿、纽约、西雅图、洛杉矶、华盛顿、芝加哥、亚特兰大等城市)、新加坡、德国、法国、以色列、日本、韩国等地组织企业家开展考察,促进优秀企业家、投资人、创业团队及政府代表与世界知名企业零距离接触,扩宽视野,寻觅合作,开拓市场。


硅谷高创会2023年企业家全球出海商务考察详细安排及背景介绍请点击蓝字链接查看:

1、硅谷高创会2023年企业家全球出海商务考察火热招募中!寻求海外订单和投资新机遇

2、报名开启!巴菲特股东大会VIP团,全球五万政商精英与股神面对面,限招席位!
3、全球创新领袖总裁香港(线下)硅谷(线上)行研学营火热招募中!参与亚洲最大春季电子展,实地走访名企,聚焦企业发展合作

▼硅谷高创会2023年企业家全球出海商务考察日程列表


为充分满足各地、各层次企业海外商务考察需求,硅谷高创会正在招募城市合伙人/合作伙伴,通过与合伙人达成的全方位、多层次的合作,为各地企业提供持续深化且个性化的商务考察服务,实现共赢。若想成为城市合伙人,请扫码联系小助手,备注【合伙人】具体咨询。


联系我们>>
欢迎添加小编微信,链接一线创业者、投资人,领取硅谷高创会加速营线上免费体验会员,进入全球高端科技创投交流群!
别忘了点关注,不迷路啊~
“专精特新”报名及合作事宜>>
工业和信息化部工业文化发展中心主办,北京高创汇智科技有限公司承办,北京大兴国际机场临空经济区管理委员会联合承办,北京大兴区投资促进服务中心支持,共同开展的“专精特新”企业创新特训营第一期在北京大兴成功举办!


欢迎各位朋友扫码添加工作人员微信(备注专精特新合作/报名),报名下一期“专精特新”企业创新特训营或成为城市事业合伙人。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
英伟达再放大招:AI的iPhone时刻来临英伟达台积电密谋的“新核弹”,计算光刻如何改变2nm芯片制造?Chatgpt的克星来了!澳洲留学生再用GPT写作业,98%概率会被抓!划时代!微软发布ChatGPT版搜索引擎苹果今晨推送新系统/ChatGPT出现泄露聊天记录的风险/英伟达ChatGPT同款超算上云ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型4 道做法简单颜值爆棚的年菜晒收入何错之有!凭什么被停职?“比妖股还妖”!4天2板,3000亿巨头暴拉涨停!英伟达放大招,提速10倍,人工智能板块沸腾了!ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!“这是AI的iPhone时刻”,芯片巨头发布ChatGPT专用GPU:速度快十倍!未来将与中国云服务商合作向左还是向右?融创与孙宏斌步入命运的决定性时刻英伟达杀入光刻领域,DPU和GPU重磅更新,首次详谈云服务!老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版速度提10倍!ChatGPT来势汹汹,计算机专业会变“天坑”吗?卡内基梅隆计算机教授揭秘年关将至高中教师养出40亿美元超级独角兽,Stable Diffusion背后数据集创建者,还发布ChatGPT最大平替英伟达将芯片计算光刻提速40倍,2纳米提前到来?通用视觉GPT时刻来临?智源推出通用分割模型SegGPT下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报什么是计算光刻?决定性时刻将至?德国将向乌提供豹式坦克,俄方:极度危险!全球“末日钟”被拨快10秒老黄手捧ChatGPT专用“核弹”炸场,英伟达H100至尊版速度提10倍!谷歌Bard遭自家员工差评/ 英伟达发布视频生成模型/ 波士顿动力机器狗整活…今日更多新鲜事在此ChatGPT全新功能公开演示!OpenAI总裁:ChatGPT会重新定义计算机(全文记录)英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLMChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇《农历新年》新《農曆新年》旧微软正式发布ChatGPT版搜索引擎和浏览器;抖音回应全国上线外卖;ZOOM宣布裁员1300人,CEO降薪98%丨雷峰早报万字长文解析!复现和使用GPT-3/ChatGPT,你所应该知道的All in AI!英伟达发布核弹级GPU,AI专用人体器官移植的真实故事集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布OpenAI新老员工对决!「叛徒」团队发布Claude模型:ChatGPT的RLHF过时啦!比尔盖茨:AI 时代开启,人生的第二次革命性时刻来了 | 深度长文
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。