北京海淀出圈,14个大模型玩家论剑2024全球数字经济大会,仿生机器人大赛启动
智东西7月3日报道,本周一,在2024全球数字经济大会(海淀分会场)的人工智能专题论坛上,360集团创始人兼董事长周鸿祎,百川智能CEO王小川,智谱AI CEO张鹏,面壁智能联合创始人、CEO李大海,生数科技联合创始人兼CEO唐家渝等大模型产业的焦点人物同台,热议当下大模型产业落地的核心话题。
新一代信息技术推动全球数字化进程加速演进,发展数字经济已经成为推进中国式现代化的重要驱动力量,AI在数字经济产业发展中具有很强的“头雁”作用,尤其是以大模型为代表的生成式AI相关技术的发展,为人工智能赋能千行百业数智化转型注入了强大动力,这也是北京市建设全球数字经济标杆城市的重要战略机遇。
大模型与千行百业的连接日益紧密,使得大模型玩家、底层算力提供商以及行业端的企业被联动起来,加速大模型赋能千行百业的时代到来。
在这之中,大模型玩家在创新技术路径的同时,与拥有智能化转型升级需求的企业合力探索大模型的应用潜力;算力提供方则构建起了全栈的算力基础设施;汽车、金融、旅行等各领域赛道玩家探索大模型落地方向的脚步加快,将自身的数据优势与大模型强大智能能力实现结合。
大模型应用新纪元已来,这已经成为行业共识。
1、互联网大厂:一个模型解决一个专业问题,外加全栈大模型基础设施支撑
360集团创始人兼董事长周鸿祎谈道,大语言模型出现使得AI拥有真正的智能,改变了人们的生产生活方式。但当通用大模型应用于企业内部时,往往会因为缺乏行业深度,对企业内部业务和知识一窍不通。因此,历经2023年百模大战,2024年产业应该思考的关键就是,大模型如何和企业具体业务结合。
大模型产业最近有几个大的趋势,万亿参数规模的模型由多个MoE模型组成;端侧大模型要让大模型上电脑、汽车、手机;参数规模较小但性能强大的开源大模型出现。
受这些发展趋势启发,周鸿祎认为,应该让一个大模型解决一个企业的专业问题,所以未来政府和企业内部一定是多个大模型协同工作。具体来看,参数规模较小的模型既可以解决企业内部需求,又可以让算力成本呈现指数级下降,并可以私有化部署在企业内部。这之后就是找到明星场景,现在的能力要结合用户需要场景才能真正发挥作用。
百度智能云副总裁喻友平也谈道,去年是大模型技术元年,今年是大模型应用元年。在通用的企业领域中,知识管理、客服和企业营销是企业通过大模型实现增收提效的最佳路径。
未来,企业基于大模型构建的应用,最核心的两个方向是知识和流程。百度智能云提供了从IaaS、PaaS到SaaS的全栈大模型基础设施,基于融合各类GPU算力的计算平台百度百舸,百度智能云构建了千帆平台,有提供大模型开发平台的ModeBuilder,以及AI原生应用开发平台AppBuilder,为用户提供全链路大模型开发能力以及应用开发平台。还有一大重要方向是数字人,喻友平认为未来凡是有对话的地方就会有数字人出现。
最后,他总结了大模型与企业场景应用结合显示出的三个重要特征:深入业务场景、数据与知识驱动、人格化。
2、大模型创企:超级模型+超级应用双轮驱动,创新技术路径让大模型可用
清华系创企百川智能已经位列国内大模型创业第一梯度。今年年初,百川智能CEO王小川就已经意识到,2024年已经进入智能纪元2.0。他对智能时代的理解就是“把语言变成数学问题”,大模型通过压缩与预测将现实世界转变成数学模型。
从落地应用角度来看,大模型实现了从连接信息到获取知识的跨越,最后的变化就是生产力的直接提升。此外,他认为除了在面向B端和C端产生服务供给,大模型在未来两三年里会走出工具思维,变成像人一样能够产生服务能力和陪伴能力。这里的探索方向就是让大模型赋能千行百业,从生产力工具走向智能助理,最后走向虚拟世界赋能。
针对当下国内的芯片能力、人才储备、市场环境,王小川提出了“理想上慢一步,落地上快三步”的逻辑。百川智能的定位就是,跟进前沿玩家验证好的技术路径,既做超级模型,也做超级应用,找到知识密度高且真正需要千亿、万亿模型的场景。
作为国内最早关注大模型研究的玩家之一,智谱AI提出GLM预训练框架和预训练基础算法,融合了单向注意力和双向注意力不同流派的特点,统一自然语言理解和生成任务统一预训练的方法,最终实现文本、图像等多种模态预训练融合,部分解决大模型幻觉问题。
同时,智谱AI正在围绕大模型构建整个产品体系和商业化服务落地的体系,包括OpenAPI的方式,以及云端私有化的方案、完全私有化软硬件一体机的部署方案。
智谱AI CEO张鹏谈道,2024年是AGI元年,模型能力已经具备了向AGI这个终极目标迈进的基础,具备了初步的语言理解、多模态理解和生成能力、智能体能力。
大模型走向行业落地,澜舟科技看到了其在产业升级和金融行业快速落地的潜力。其中,产业升级指的是央国企、金融机构、传统企业在数字化深度转型中释放出来的场景。
基于这两大落地场景,澜舟科技采用的策略是“一横N纵”,也就是一个大模型系列+N个应用方向。澜舟科技联席CEO李京梅谈道,其底层是孟子大模型,包括通用、轻量版、标准版等。在企业应用这一层,澜舟智库构建了企业智能数据库,包括文档解析等一系列端到端的能力,当企业各种业务部门具有不同个性化、定制化需求的时候,企业可以自主应有去定制低代码拖拉拽方式打造应用。
生数科技深耕的领域是多模态大模型,生数科技联合创始人兼CEO唐家渝谈道,其采用的Diffusion Transformer架构结合了扩散模型和Transformer架构各自优点,一方面可以在音视频领域实现好的生成效果,同时可以提高更强的扩展性。因此,基于这个架构生数科技已经在研究产业级多模态大模型,自研底层建模理论框架到整体网络训练优化、整体调优,并且在上层已经对外提供了多方面能力。
3、端侧大模型玩家:可靠、隐私是核心优势,终端都将拥有“大脑”
相比于云上大模型,端侧大模型的核心优势是可靠、隐私。这在大模型走向行业落地的过程中至关重要。
基于此,面壁智能总结出了一条规律也就是大模型参数的摩尔定律,大模型每八个月的知识密度会提高一倍,知识密度简单来说就是一定的大模型参数重可以压缩的知识比例。出于对技术路线的判断,面壁智能在2024年初将战略风向完全聚焦在了终端上。在发布参数规模较小的MiniCPM面壁小钢炮系列模型之外,面壁智能还聚焦于端侧大模型和芯片的整合。
面壁智能联合创始人、CEO李大海谈道,他们称OpenAI走的路是“无所不能”,而终端是“无所不在”。在AGI时代的终端,未来都会慢慢拥有类似人的大脑、人的智商水平,能够跟环境进行深度互动。
联想已经在探索大模型在终端设备上的应用。联想集团副总裁范建平谈道,联想端侧个人体的定义是,基于大模型的能力去感知用户意图,再进去复杂任务分解,并调用知识库和工具库执行任务,与此同时还需要记忆机制,可以对此前的能力或者任务进行经验总结。
联想AI PC的五大特点,就是内嵌个人大模型与用户自然交互的个人智能体、个人知识库、本地异构AI算力、开放的AI应用生态、个人数据和隐私安全保护。
4、算力提供方:大算力集群是必要基础设施,为大模型供给和客户需求架桥
短期来看,大模型第一性原理Scaling Law将会一直适用,因此大模型技术路线的主战场一段时间内将仍在更高参数规模的竞争赛道中,这就对算力提出更高的要求。
因此,阿里云副总裁安筱鹏认为,大算力集群将成为全球大模型竞争的必要基础设施。这背后的三个关键问题就是,芯片的性能不等于智算集群的输出能力;自主可控不等于技术封闭;技术可用并不等于商业可行,技术可行只是商业可行的必要不充分条件。
这也说明了算力体系建设上的三个核心要素,如何构建一个先技术先进的体系能够满足更高参数的训练,从万卡到超万卡的技术体系是今天模型发展的、持续不断探讨的课题;需要构建一个生态开放的,能够兼容各种技术体系和框架的生态;要探讨商业上可行的技术路径。
在弥合大模型供给与企业需求之间鸿沟的背景下,中国电信的定位就是做AI一站式服务提供者,或者说是整体解决方案提供者,基于“1+1+1+M+N”架构,前三个“1”指的是智能云、数据底座、通用大模型,M是内部大模型、N是行业大模型。
中国电信北京公司副总经理孙健称,中国电信已经在全国布局了算力基础设施,这张天然的算力网将为未来的推理需求打下基础。中国电信还自主研发了星辰大模型,支持30种语言的处理,拥有超过8000万条摄像头平台数据。通过NaaS解决方案将算力、数据加工以及模型融合,为客户特定场景做特定适配,以最高的性价比解决客户的问题。
5、行业应用端:AI4S帮助AI理解底层规律,汽车、出版、旅行业已加速落地
AI for Science是让AI学习世界底层运行的基本科学规律,再去解决科学问题和实体工业问题。围绕着微观尺度的工业研发,深势科技打造了AI for Science大模型体系深势宇知。
深势科技CEO孙伟杰谈道,未来通用人工智能实现必须理解数字世界,包括语言、图片、音视频等,这些事目前大模型主要做的工作,另一方面,就是AI for Science工作者所要去实现的核心使命,让物理世界被AI理解。第三部分就是AI要和世界交互以改变和控制客观世界。
他谈道,基于AI for Science方法打造的一系列科研和行业研发在微观尺度研发的引擎和工具,最后赋能实体工业,将成为以信息、生命、材料和能源为代表的人类文明最主要的支柱。
在汽车领域,智能座舱的发展呈现出三个阶段。理想汽车智能空间副总裁勾晓菲谈道,第一个阶段是传统座舱和车内基础功能打交道,现在的第二阶段最典型特征就是安卓上车,将大量丰富安卓应用生态引入汽车。
下一个阶段就是AI智能座舱时代,他认为其分水岭就是大模型上车。智能座舱承载的核心是人机交互,未来AI通过语言将成为座舱的主要交互形态。
在数字出版和知识服务行业,同方知网基于自身数据优势以及自然语言处理的技术积累,打造了华知大模型,就是中华知识大模型。
同方知网总经理张宏伟谈道,AI发展将颠覆内容产业、知识产业,因此知网这类知识服务平台应该率先自我革命,对于出版业而言,他们追求提供真正的知识服务,也就是直接面向用户问题直接提供解决方案。在大模型时代,其可以通过自然语言的方式,让用户提出一个问题,同时让大模型基于海量文献生成有来源的答案。
旅行行业,去哪儿早在初创时期,就已经工程技术聚合机票价格进行搜索比价。在大模型应用当面,去哪儿网通过AI判别模型,可以根据用户的需求提供个性化的搜索推荐,并且通过提高代码开发效率和质量提升了内部工作效率。
去哪儿副总裁孙斌认为,全能个人旅行管家时代已经到来。基于大模型能力,个人助手可以为用户解决旅行前、中、后的各项个性化需求。
一方面,大模型要快速深入行业应用,另一方面企业渴望改变自身能力去拥抱AI,这中间存在大模型供给和客户需求的鸿沟,这就需要全产业链的玩家共同发力。
大模型急速发展的当下,除了身处其中的各链路玩家,北京海淀作为国内科技产业发展高地,已经形成了一片科技玩家技术创新、应用落地的沃土。
海淀区是国内AI领域创新基础最好、人才资源最密集、研发能力最雄厚、产品迭代最活跃的地区,AI学者已经超过1.23万人,占全市比例超过80%,基本形成了芯片、框架、大模型、数据技术与处理服务等全产业链部署,集聚企业超过全市七成。大模型相关单位超过100家,通过备案的大模型超过了49款,占全市七成以上。
去年,第二批北京市通用人工智能产业创新伙伴计划名单公布,一年时间,这些玩家就实现了从最初概念验证到实际应用、单一技术突破到全方面的行业解决方案,不断加速大模型应用。与此同时,包含工业大模型应用、服务政策咨询大模型、数据开源开放平台、法律知识系统项目、算力、金融等诸多领域的第三批伙伴计划也于当天公布。
为了进一步加速大模型在传统消费领域的应用场景测试,北京人工智能产业联盟联合在京备案的阿里云、火山引擎、小米科技、网易有道等大模型企业,共同开展“大模型体验券”的发放体验活动。
当下在大模型应用中,且与通用人工智能密切相关的具身智能,已经成为大模型产业的技术创新前沿阵地与焦点。早在今年4月,海淀区就发布了《关于打造全国具身智能创新高地的三年行动方案(2024-2026年)》,此次中关村仿生机器人大赛就是其中“生态雨林打造行动”的重要一部分。
融合了新材料、新设计、AI等前沿技术的仿生机器人,已经成为新质生产力的典型代表。
基于现阶段仿生机器人研究热点,根据仿生机器人形态和技术应用,大赛设置了人形仿生机器人、多足仿生机器人、具身大模型以及其他仿生机器人4个赛道。
具体的赛制分为三轮,初赛由专家评委进行基本情况审查,复赛为现场答辩及参赛机器人基本技能演示,决赛依据比赛规则进行现场竞技。
此次大赛的评委阵容重磅,中国工程院院士刘宏为大赛专家委员会主席,中国科学院院士丁汉、中国工程院院士王耀南、中国工程院院士于海斌和中国工程院外籍院士、德国国家工程院院士、德国汉堡科学院院士张建伟为专家委员会联席主席,以及20位知名专家学者组成大赛专家委员会,负责各赛道规则制定及评审。
主赛道共设置24个奖项及全能优胜奖9名,第1名奖金15万元、第2名奖金10万元、第3名奖金5万元;创新赛道共设置5名创新优胜奖,奖金3万元。除了255万元的总奖金池外,本次大赛还通过市区镇三级联动以及银行机构,对企业在空间落地、融资、人才教育、租金等诸多领域全方位支持。北京市经信局、中关村科学城管委会、海淀区金融办、四季青镇、东升镇、温泉镇、海新域集团协同北京银行中关村分行为企业提供了一系列的落地支持。
我国已经成为当下全球机器人产业发展的中坚力量,在机器人领域具有得天独厚优势的海淀区正在将自身优势充分发挥出来,打造国际国内基础科技含量最高、学科跨度最广、产业引领性最强的仿生机器人竞赛。海淀区聚焦了北京市40%的企业,人形机器人企业数量近200家(占全市半数以上)。此次大赛将有效推动“人才、项目、产品、技术、市场、资本、空间、服务”等创新创业要素的全面对接,为区域产业发展注入新的活力。
作为海淀区两家人形机器人产业的代表玩家,星动纪元和理工华汇都孵化于海淀区的知名高校。
由清华大学交叉信息研究院孵化的星动纪元已经开发了具身智能人形机器人全栈技术架构,推出了全尺寸人形机器人XBOT。星动纪元联合创始人席悦谈道,一定程度上可以推动技术的合作交流,另一方面能推动客户与场景的交流,实现机器人行业在技术、场景、客户领域取长补短,推动行业发展。
基于北京理工大学机器人团队成立的北京理工华汇,其推出的人形机器人汇童系列已经可以实现走、跑、跳、摔、滚、爬的多模态运动。理工华汇公司总经理佘浩田谈道,机器人大赛可以更清晰让他们认识到自身的优势,以及与其他企业的差距,并且明确与其他玩家竞争、合作的方向。
可以看出,本次大赛将为全链路的机器人产业玩家搭建一个交流创新思想、展现创新成果、孵化创新项目、探索创新发展路径的新平台。
AI等前沿技术狂飙突进的背后,全球数字经济产业正显著增长。数字经济蓬勃发展,成为推动北京市高质量发展的强大动能。
在此基础上,北京在数字经济发展中已经初步构建起开放共赢的数字经济领域国际合作平台。今年是京津冀协同发展国家战略实施的第十年,在AI产业加速发展的新局面下,为加强京津冀智库合作交流,将进一步发挥智库赋智赋能作用和“政、产、学、研、金、服、用”平台作用,促进京津冀三地广泛、深入协同发展。
微信扫码关注该文公众号作者