百度副总裁吴甜:“百模大战”终局会集中在少数几个大模型上
7月19日,百度集团副总裁吴甜在与记者交流中表示,国内“百模大战”将会走向在少量大模型上衍生出广泛应用生态的终局。大模型产业生态可类比芯片代工厂,把大数据、大算力、大算法都封装,建设自动化、数字化、标准化的生产模式。
多个行业调研报告显示,生成式AI正在给整个产业结构,甚至给人类社会带来越来越深刻的影响和变化。吴甜表示,“在OpenAI发布ChatGPT之前,真正在做大模型的企业、机构寥寥可数。然而在过去短短的几个月时间内,大量新模型出现,这是一个阶段性的现象。在未来演变过程中,各个企业和机构会逐渐找到自己的定位,下一步将逐渐走向细分方向。”
她认为,国内“百模大战”的终局会集中在少量的几个大模型上。原因首先在于真正从底层做起来的大模型成本非常高。“像文心一言这样的大模型并不是想要做就能做起来的,需要有多年的积累、综合的能力和坚定的信心,一直投入下去,才能够做好。从这一点上可以看到,将来只能有少数的大模型。”她说。
另一方面,在应用层面,未来想象空间非常大。吴甜表示,大模型在每一个行业都有广阔的应用空间。未来依托几个少量大模型,将会衍生出非常广泛的应用生态。
然而,如何让大模型真正在产业当中形成价值,依然值得探索。吴甜指出,现阶段大模型的产业化面临着三大挑战。首先是模型大带来的训练难度高、成本高;第二,对于算力规模要求非常大,性能要求高;第三,数据规模大,收集、挖掘、建设、筛选、清洗这些数据本身也是一项巨大的工程。
“对于应用者来说,并不需要针对每一个应用进行大模型的开发。”吴甜表示,大模型的产业模式可以类比芯片代工厂。现在芯片的型号、厂商非常多,但是代工厂只有几家而已。芯片代工厂需要部署大量昂贵的设备和产线,要有精密的工艺流程,并且可以对生产过程进行封装。然而,整个社会其实不需要有非常多的企业都来实现这样的能力。对于有芯片生产需求的公司来说,只要拿出生产方案,交给芯片代工厂生产,就可以得到想要的芯片。
“大模型的产业模式也应该如此。大模型平台是价格昂贵的大算力系统,可以把大数据、大算力、大算法都封装,并且可以建设自动化、数字化、标准化的的生产模式。应用方只需定义好问题,把对AI模型的能力要求交给大模型平台,由大模型平台进行生产,这样才有可能实现产业应用遍地开花。”吴甜表示。她认为,大数据、大算力和强算法通过开发训练的过程,都可以封装给大模型平台,让千行百业都可以使用。只有这样,大模型才能真正高效地支撑起千行百业的应用。
记者了解到,最新发布的《AI大模型技术能力评估报告》显示,百度文心大模型评分为3.5,以12项指标7个满分,综合评分排名第一。在代表基础能力的算法模型和代表产业应用情况的行业覆盖方面,文心大模型都是唯一拿到满分的大模型。
吴甜表示,百度一直在践行这样的理念。去年百度和11个行业当中的龙头企业机构,一起联合发布了行业大模型,行业大模型的机制也一样,在通用大模型基础上,加入行业自有的数据知识及专家经验,生产出来的新的模型,在行业当中有更好的适配性。“可以看到,大模型已经在这条路上赋能千行百业,相信未来能够给产业升级带来巨大的支撑作用。”她说。
微信扫码关注该文公众号作者