Redian新闻
>
中国工程院院士郑纬民:建好AI生态,大模型产业才能更好发展

中国工程院院士郑纬民:建好AI生态,大模型产业才能更好发展

公众号新闻

11月4日,第二届开放原子开源基金会 OpenHarmony技术大会在京召开。中国工程院院士、清华大学计算机系教授郑纬民在会上表示,要大力开展基于国产AI芯片大模型基础设施研究,完善国内AI生态系统建设,做好整体系统工程化,关注软硬件协同设计,解决大模型基础设施建设的关键问题。

郑纬民坦言,国内AI生态尚未建设完善,“国产AI芯片只要达到国外芯片60%的性能,如果生态做好了,客户也会满意。大多数任务不会因为国产芯片性能只有(国外芯片性能的)60%而有明显感知,大家感觉到的不好用还是生态不行。即使硬件做的很好,甚至比国外做的更好,但如果生态没有做好,依然不被喜欢”
软件主要提供的是灵活性和效率提升,硬件算力提供了最基本的资源基础。要建好生态,首先要做好整体系统工程化、软硬件协同设计。当前,新型硬件的使用对软件系统设计提出了巨大挑战。比如,随着应用程序对算力需求的日益提升和摩尔定律的逐渐放缓,新型计算硬件,特别是异构加速处理器,成为了高性能计算发展的主流;为了打破存储墙对应用程序计算性能的桎梏,新型存储器件,如固态存储设备SSD等,也被广泛应用于高性能计算机。
与此同时,人工智能、图计算、大数据等的广泛应用让软件也变得更为复杂。如何在新型硬件系统上设计与优化新型应用程序,新的硬件、新的软件如何做优化设计、做适配,成为一个亟待解决的关键问题。
人工智能计算具有计算密度高、需要大量低精度计算的特点。郑纬民指出,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡模式已经无法满足超大模型进行训练的要求,包括数据并行、模型并行、专家并行在内的并行训练已成为大模型训练的“标配”。
比如在国产的新一代神威高性能计算机中,包含了96000个节点、37440000个核心以及互连网络。神威采用的是新一代体系结构芯片——神威26010pro,以及支持MPI通信的国产自主高速网络。神威超级计算机契合了大规模预训练模型的需求。据悉,郑纬民院士团队在国产E级高性能计算机上训练了一个170万亿参数的超大规模预训练模型,模型参数可与人脑中的突触数量相媲美。
“在训练这一超大规模预训练模型中,需要考虑四个问题:一是半精度运算性能与双精度运算性能的平衡;二是网络平衡设计;三是内存平衡设计;四是核心子系统平衡设计。这四点做好了,别人要用1万块AI芯片训练大模型,我们只用9000块就可以了。”郑纬民感叹说道。
生态是一切产业发展的基础。完善的生态可以加速知识、技术、应用场景的积累,使创新成果更快地转化为产品,连接产业链上下游,也可以为人才的培养和流动提供良好平台。
郑纬民表示,在数字经济时代,摩尔定律的持续实现,为人工智能的进一步发展提供了关键的基础,需要通过软硬件密切协同,才能进一步加速算力提升和使用效率。算力、网络具备很强的公共基础设施特性,只有加快建立一个开放性的产业生态,把选择权交给用户,才能驱动行业百花齐放,从而真正促进大模型产业的健康发展。

延伸阅读:

当笔记本电脑开始折叠……

英特尔代工业务:离“重返行业巅峰”又近一步?



作者丨宋婧

编辑丨赵晨

美编丨马利亚

监制丨连晓东

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
正在公示!中国工程院2023年院士增选有效候选人材料聚焦丨喜报!这些学长新当选中国科学院、中国工程院院士中国工程院发布“中国电子信息工程科技十四大挑战(2023)”中国工程院院士许祖彦:2025年将是激光显示产业化关键年份大模型时代,这个方向更好发论文了!“中国工程院大学”要来了?最新回应百度何俊杰:用大模型构建多元AI原生应用生态,推动产业升级与经济增长|WISE2023商业之王大会2024年或成国产大模型应用爆发年!有道再推多款大模型产品及应用Carl Doy - 月亮代表我的心 - The Moon, My Heart and more英国皇家工程院国际院士、欧洲科学院院士许彬:未来虚拟世界将以沉浸式方式与物理世界共存中国工程院院士丁文华:超高清视频为元宇宙产业发展奠定重要技术基础对话中国工程院院士罗锡文:中国为什么要发展智慧农业中国院士亲属关系表,一起来看看我国各大院士及其家族院士成员!中国工程院院士许祖彦:自主创新为新型工业化添动力厉害了,我的国!外星人都知道杭州要办亚运会了工程院院士候选人材料正式公示从中专生到院士!厦门大学夏宁邵如何从中专学历逆袭成为 2023年中国工程院院士?重磅!2023年两院院士增选当选院士名单,公布"中国工程院大学"要来了?官方回应“虎妈”蔡美儿咸鱼翻生,又成道德楷模官宣!2023年两院院士增选结果揭晓!颜宁当选中科院院士!大模型产业实践专场(一):在市场调查、企业数字化、教育培训中的实践 | 第16届中国R会议暨2023X-AGI大会长篇小说《谷雨立夏间》序中国工程院院士戴琼海:形成通用人工智能技术的中国方案迫在眉睫刚刚,国常会最新定调!大力发展专利密集型产业!中国工程院院士、华南理工大学校长张立群 | 以创新基因导航教育强国建设香港科技大学校董会主席、美国国家工程院外籍院士沈向洋:未来世界将由人工智能体和人类共同打造大模型产业实践专场(二):在市场调查、投资和文献引用预测中的实践 | 第16届中国R会议暨2023X-AGI大会拓尔思施水才:大模型产业落地需解决的五大问题中央金融工作会议重磅定调!更好发挥资本市场枢纽功能,活跃资本市场更好支持扩大内需…信息量巨大→李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型中国工程院院士周济:今后五年工业企业数字化转型是推进智能制造的主战场超强嘉宾阵容公布!中国工程院院士、专家大咖确认出席AIoT年会!高质量人脉已就位,速来!看了胡歌的《不虚此行》才明白:只有直面死亡,才能更好地活着Stanford Exp: Think out of the box creative, non-linear, asymmet
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。