英伟达发布ChatGPT专用GPU,计算光刻提速40倍!AI的决定性时刻来了
就在昨晚,人工智能计算领域的领导者英伟达召开了2023 GTC大会,黄仁勋先生在大会上围绕量子计算、芯片等前沿科技,发布了一系列前沿技术和产品,同时还分享了AI领域的最新进展及未来趋势。
(图源GTC大会)
“切勿错过AI的决定性时刻!”这是英伟达2023年GTC大会的宣传语。从上周三到现在,一系列AI技术相继发布,从OpenAI发布GPT-4,到百度发布文心一言,再到微软发布Office的AI助手Microsoft 365 Copilot,甚至在几小时前,谷歌也上线了Bard聊天机器人接受排队测试。
随着生成式AI掀起一波机遇浪潮,AI正处于关键时刻,海内外大厂都不甘居于人后。由于生成式 AI、多模态、大型语言模型需要处理复杂的数据和任务,涉及多个学科和领域的知识,需要不断突破计算和存储的限制,手握GPU算力技术的英伟达可算是“赢麻了”。
(图源GTC大会)
企业家全球考察团火热招募中>>
硅谷高创会汇聚全球创新资源,聚焦企业出海与引入落地,将组织企业家开展考察,促进优秀企业家、投资人、创业团队及政府代表与世界知名企业零距离接触,扩宽视野,寻觅合作,开拓市场。
考察团详细介绍及报名方式请点击蓝字链接查看:
1、全球创新领袖总裁香港(线下)硅谷(线上)行研学营火热招募中!参与亚洲最大春季电子展,实地走访名企,聚焦企业发展合作
(图源GTC大会)
此外,黄教主还发布了针对其他不同工作负载可进行优化的推理平台配置——L4 Tensor Core GPU、L40 GPU、Grace Hopper超级芯片。
(图源GTC大会)
针对AI视频工作负载,英伟达推出了L4,在视频解码和转码、视频内容审核、视频通话功能上做了优化,可以提供比CPU高120倍的性能,能效提升约99%。一台8-GPU L4服务器可以取代100多台用于处理AI视频的双插槽CPU服务器。目前,英伟达GPU在AI视频生产技术供应商Runway的产品中已经提供了相应的技术支持。
针对Omniverse、图形渲染以及文本转图像/视频等生成式AI,英伟达推出了L40。L40性能是英伟达最受欢迎的云推理GPU T4的10倍。Runway推出的Gen-1,以及Gen-2生成式AI模型拥有的强大能力便是借助了英伟达的GPU。
Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。
(图源GTC大会)
黄仁勋带来的另一项革命性技术是NVIDIA cuLitho的计算光刻库,NVIDIA cuLitho计算光刻库是英伟达联合晶圆制造巨头台积电、光刻机制造商ASML和EDA巨头Synopsys,历时4年完成的,这不仅是一项聚焦先进芯片设计制造的技术,也关乎英伟达自身的产品研发。
在到达2nm制程的极限后,光刻就是突破点。NVIDIA cuLitho计算光刻库可以通过计算技术大幅优化芯片制造流程,利用GPU技术实现计算光刻,可以使传统光刻技术提速40倍以上,功耗可以降低9倍,为2nm及更先进芯片的生产提供助力。
(图源GTC大会)
据黄仁勋介绍,在芯片设计和制造领域中,计算光刻是最大的计算工作负载,每年都要消耗数百亿CPU小时。英伟达创造的这个新算法,可以让日益复杂的计算光刻工作流程能够在GPU上并行执行。此外,黄仁勋还表示,由于光刻技术已经处于物理学的极限,晶圆厂能够提高产量,为2nm及以后的发展做好准备。
面向量子计算,英伟达与Quantum Machines合作推出了全球首个GPU加速量子计算系统NVIDIA DGX Quantum,将强大的加速计算平台(由NVIDIA Grace Hopper超级芯片和CUDA量子开源编程模型支持)与全球最先进的量子控制平台OPX结合在一起,使研究人员能够构建强大的应用,将量子计算与最先进的经典计算结合起来,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟,还能实现校准、控制、量子纠错和混合算法。NVIDIA DGX Quantum为从事量子计算的研究人员提供了一个革命性的高性能和低延迟的架构。
(图源GTC大会)
DGX Quantum还为开发人员配备了一款强大的混合GPU-Quantum编程模型NVIDIA CUDA Quantum,可以在一个系统中集成QPU、GPU、CPU并进行编程。多家量子硬件公司将CUDA Quantum集成到他们的平台中。
大会上,英伟达宣布推出NVIDIA AI Foundations云服务,让客户可以定制LLM和生成式AI。据黄仁勋介绍,NVIDIA AI Foundations是一个云服务和代工厂,用于构建自定义语言模型和生成式AI。该服务包括语言模型NEMO、视觉模型PICASSO和生物学模型BIONEMO。
(图源GTC大会)
NEMO是用于自然语言文本的生成式模型,可以提供80亿、430亿、5300亿参数的模型,且会定期更新额外的训练数据,可以帮助企业为客服、企业搜索、聊天机器人、市场分析等场景定制生产生成式AI模型。
(图源GTC大会)
PICASSO则是视觉语言模型制作,可以用于训练自定义模型,包括图像、视频和3D应用。只要向Picasso发送文本提示和元数据的API调用,Picasso就会用DGX Cloud上的模型把生成的素材发送回应用。值得一提的是,把这些素材导入NVIDIA Omniverse,就可以构建逼真的元宇宙应用,和数字孪生仿真。
BIONEMO是专门为用户提供创建、微调、提供自定义模型的平台,包括AlphaFold、ESMFold、OpenFold等蛋白质预测模型。生物圈的热门方向是利用生成式AI发现疾病靶因、设计新分子或蛋白类药物等。
(图源英伟达官网)
Nvidia DGX Cloud将透过多个云端服务供应商提供,微软Azure预计于下一季起托管DGX Cloud服务,包括Google Cloud等业者也将陆续开始供应服务,DGX Cloud执行个体价格为每个执行个体每月36,999美金起。每个DGX Cloud执行个体皆有8个NVIDIA H100或NVIDIA A100 80GB Tensor GPU,单一节点具备640GB 的GPU记忆体,并透过NVIDIA Networking技术提供高效能、低延迟网路,使多个执行个体等同一个超大型GPU。
DGX Cloud将NVIDIA DGX强大的运算效能搬到云端平台,提供专用的NVIDIA DGX AI超算丛集,并同样可使用持续进化的NVIDIA AI软体;企业能够透过网路浏览器即可享有AI超级电脑的运算力,省却购置、部属与管理的复杂性。DGX Cloud包括NVIDIA AI平台软体层NVIDIA AI Enterprise提供端到端的AI框架与预训练模型,同时在此次的GTC大会也公布全新的NVIDIA AI Enterprise 3.1版本,带来全新预训练模型、最佳化的框架与加速资料科学软体库。
(图源GTC大会)
2023年以来,ChatGPT以摧枯拉朽之势,以期掀起第四次科技革命。在GTC大会上,黄仁勋将也将“我们正处于AI的iphone时刻”重复好几遍,很明显,生成式AI将几乎重塑所有行业。
从英伟达的发布会上,我们可以看到英伟达对先进AI计算的支撑已经覆盖了从GPU、DPU等硬件到帮助企业加速构建定制生成式AI模型的云服务。英伟达通过不断创新和技术升级,推动AI技术的发展,为各个行业和领域带来更多的机遇和挑战。
硅谷高创会2023年企业家全球出海商务考察详细安排及背景介绍请点击蓝字链接查看:
1、硅谷高创会2023年企业家全球出海商务考察火热招募中!寻求海外订单和投资新机遇
▼硅谷高创会2023年企业家全球出海商务考察日程列表
为充分满足各地、各层次企业海外商务考察需求,硅谷高创会正在招募城市合伙人/合作伙伴,通过与合伙人达成的全方位、多层次的合作,为各地企业提供持续深化且个性化的商务考察服务,实现共赢。若想成为城市合伙人,请扫码联系小助手,备注【合伙人】具体咨询。
微信扫码关注该文公众号作者