Redian新闻
>
首批大模型通过备案,更激进的投入开始了

首批大模型通过备案,更激进的投入开始了

财经

当 “限速” 被放开,是时候看看谁快谁慢了。

文 | 贺乾明

编辑丨程曼祺

8 月 30 日晚上,百度公关团队加班加点准备宣传材料,目标是在时钟跨过 0 点后,第一时间对外发布大模型应用文心一言全面开放的消息,最终在 0:02 发布成功。


同一时刻,百度也提前部署了大量算力支持文心一言等大模型应用,以应对这次全面放开后可能激增的用量。


紧接着,31 日凌晨 1 点 44 分,大模型创业公司智谱 AI 宣布大模型应用 “智谱清言” 正式上线;3 点 09 分,百川智能称通过 “生成式人工智能备案”,开放公众服务。


更多消息在今天清晨传播开来:字节跳动、商汤、MiniMax、中科院、上海人工智能实验室等公司和机构也宣布其大模型已通过备案,将开始正式对外提供服务。


《晚点 LatePost》了解到,科大讯飞、华为、腾讯和阿里巴巴开发的大模型也在首批通过备案之列。阿里的通义千问也即将对外开放服务。


“对我们来说,今天这个节点比 3 月 16 日发布大模型还重要。” 一位百度人士说。他和不少同事都记得百度发布大模型到现在已过去 167 天。


随着第一批大模型应用通过备案上线,中国人工智能大模型市场进入全新竞争阶段,科技公司和机构基于大模型研发的产品,可以向所有用户提供服务,而之前只能开展人数受限的测试。


“大模型的进化高度依赖用户反馈,更多人使用后,会有更多数据反馈用于改进大模型。” 百度科技与社会研究中心主任余欢说,百度正在尝试提高大模型的迭代速度。“原本计划年底发布新版本模型,现在我们正在加速,尽可能提前发布。”


百川智能创始人王小川告诉《晚点 LatePost》,百川智能将在今年第四季度发布千亿参数模型,在明年一季度推出 “超级应用”。据了解,半个月前发布新版大模型的科大讯飞,也会在通过备案后,加快大模型应用的推广速度。


新环境使大模型竞争变成了一场综合能力试炼:致胜因素将不再只是一家公司训练大模型的技术实力,还有它洞察市场需求、开发与之匹配的应用和做好运营的能力。


围绕新用户和客户的拉新、增长与产品的更激进投入即将开启。当 “限速” 被放开,是时候看看谁快谁慢了。

政策落地,一批大模型将公开上线

《生成式人工智能服务管理暂行办法》正式实施的 8 月 15 日,是中国大模型公司通过备案的关键节点。一名大模型从业者说,这之后,有关部门开始召集一些大模型公司开会,进行备案培训并下发备案材料模板。


据了解,备案过程中,监管部门关注数据安全、数据来源问题,比如数据是否侵犯知识产权或侵犯隐私;监管部门同时建议,各公司大模型在完成聊天任务时,“拒答率不能过高”。


在大模型备案工作开始前后,本轮通过备案的大型科技公司,都或多或少释放了大模型进展:


  • 7 月底,腾讯开始在多个业务线测试混元大模型,预计将在下月宣布新进展。两个月前,腾讯 CEO 马化腾说,不急于早早把半成品拿出来。


  • 8 月初,字节跳动公开测试大模型应用 “豆包”,底层模型就是本次通过备案的 “云雀” 模型。


  • 8 月 4 日,华为宣布将盘古大模型集成到鸿蒙系统中,将通过手机中的语音助手提供生成邮件、自动操控手机软件等功能。


  • 8 月 15 日,科大讯飞发布讯飞星火大模型 2.0 版本,增加生成、理解图像和代码的能力,并与华为联合推出星火一体机,为政企客户本地部署大模型提供解决方案。


  • 几天前,百度群发短信,提醒文心一言内测用户获得 “百度搜索 AI 伙伴” 内测资格,可以通过百度 App 和百度搜索引擎使用类似 New Bing 的功能。


首批通过大模型备案的创业公司中,智谱 AI、百川智能和 MiniMax 近期也在快速迭代自己的大模型。6 月,智谱 AI 升级推出 ChatGLM2 系列,新增 3 个不同参数规格的模型,最多可以处理 3.2 万个 token(token 与文字处理量成正比)。


今年 4 月成立的百川智能在过去 4 个月里快速推出 3 个模型,两个开源、一个闭源,最高参数达到 530 亿。创立于 2021 年底的 MiniMax 7 月完成自有模型 ABAB 的一次大版本升级,并以周为单位提升性能。


创业公司背后亦有大公司身影。美团于今年参与智谱 AI 的 B-2 轮融资。腾讯也已于今年 6 月投资了 MiniMax。智谱 AI 和 MiniMax 都已成为估值超 10 亿美元的独角兽。


目前通过备案的大模型公司,多数已经宣布面向社会公众开放。不过通过备案本身可能不会成为一种大模型竞争的长期优势。


参与了备案的多位行业人士的观点是,接下来陆续会有更多的大模型公司通过备案,“不会只有第一批,也会有第二批、第三批”。

推广不再受限,大模型商业化加速

大模型应用 “通过生成式人工智能备案” 后,最直接变化是,产品可直接面向社会公众提供服务。


这之前,大部分公司推广大模型应用时相对克制,它们面向个人用户的产品皆是内测、邀测形态,一般用户无法直接注册、使用,各公司也不会主动投放广告推广大模型产品,这抑制了产品扩散。


政策落地则会推动公司投入资源推广大模型,最终加速大模型的商业化。目前大模型行业主要有四种变现模式:


  • 开发大模型对话应用,按月 / 年向用户收费。比如 OpenAI 的 ChatGPT Plus 服务等。


  • 出售大模型 API 接口,向公司或开发者按照调用次数收费,比如 MiniMax 与金山办公 WPS 的合作。


  • 直接卖大模型开发服务,向传统企业输出大模型行业解决方案挣钱,比如百度、腾讯、讯飞、华为大力推广的行业大模型方案。


  • 拥有大模型的公司,还可以用大模型改造现有业务,提高产品的竞争力获得更多商业回报。如 Google、百度等公司正在用大模型优化搜索产品;钉钉把大模型融入到产品功能中;阿里曾表示要用大模型改造电商业务等。


大模型陆续通过备案后,最明显的市场变化之一是,直接面向个人消费者的产品会变得更多、更活跃。


据悉,MiniMax 接下来会推出面向公众的产品,但暂未披露细节。


王小川称,明年一季度,百川计划推出第一款面向个人的 “超级应用”。他在 8 月上旬的媒体沟通会上说,百川智能 “未来不只有一款超级应用,(更多产品)正在研发的路上”。


大规模的产品推广,同时能为面向企业客户的业务引流。一位百度人士说,百度暂时不会在面向公众的文心一言产品上收费,但这是一个展示技术能力的好方法,“有助于吸引企业用户”。


企业级市场是本次大模型获得备案前,整个行业已在着力推进的方向。腾讯、科大讯飞、华为此前在不同场合提到,它们已面向十多个行业发布了数十个、甚至上百个大模型解决方案。MiniMax 也宣布,其面向企业客户的开放平台已接入超百家付费客户。


大模型本身的技术竞赛还在继续。一位百度人士称,公司正全力加速研发新版本的大模型,希望能提前发布。百川智能方面称,将按之前的研发计划,陆续发布 Baichuan2 的 70 亿参数和 130 亿参数版本,年底计划推出千亿参数大模型。科大讯飞计划在 10 月 24 日推出中文超过、英文能力与 ChatGPT 相当的大模型,在明年上半年对标 GPT-4。

大模型发展进入新阶段

截至现在,中国已有上百个参数超过 10 亿的大模型。政策落地、大模型商业化加速的另一面是,参与者们将面临更激烈、综合的竞争。当 “限速” 被放开,才能试出领先者的极限,而跑得慢的人,则可能面临淘汰。


从大模型发展更快、监管后置的海外市场看,大模型的竞争力主要体现在三个方面:


  • 计算基础设施。当大模型应用获得大量用户后,会消耗大量算力。OpenAI 一度暂停了付费用户注册,并严格限制用户调用 GPT-4 的次数,核心原因就是算力跟不上用户增长速度。


  • 专有数据。市场上多数的预训练大模型,都是用一样的架构、公开数据集和类似的方法训练的。大模型拥有差异化能力的关键在于用什么样的数据去微调它。这些数据的数量多少和质量差别,将直接决定一个大模型的能力。


  • 商业应用。基于大模型做应用不难,但想要基于百亿甚至千亿参数模型做应用,需要大量 GPU 做推理计算。一位行业人士判断,参数上千亿的大模型,训练与推理成本大概是 1:9。这意味着必须找到商业价值足够大、足够赚钱的场景,才能让大模型应用变得划算。在更庞大的应用场景中,大模型供应商也能得到更多用户的反馈,不断改进模型。


大模型的竞争会在某些层面会有利于资金雄厚、本身就已聚集海量用户的大公司,比如百度、腾讯、华为、阿里巴巴、科大讯飞和字节跳动等。


不过一位基于其它公司大模型,开发生成式写作应用的创业者告诉《晚点 LatePost》,他并不是很担心备案后,大公司在应用层加大投入,挤压中小公司。“热潮之前已退去不少,很多应用都进入深了度集成 AI 的过程,也就是 AI 本身不是卖点,关键还是看对用户需求与场景的把握。” 在这一竞争点上,他认为大小公司都有机会,代表性的产品包括 Notion 和钉钉等。


还有许多创业公司也正在与用户体量较大的公司建立合作关系,提升实力。比如 MiniMax、智谱 AI 都接入了金山办公的 WPS。


据了解,美团投资智谱 AI 前,已花费上千万元购买了其大模型授权,计划在此基础上探索相关应用。


所有大模型公司接下来面临的重大考验是:怎么找到真正赚钱、可持续的大模型商业模式。


“我们不能只是推动人工智能,却没有支撑它的商业模式。” 云数据库公司 Snowflake CEO 弗兰克·斯鲁特曼(Frank Slootman)在八月的财务电话会议上说。他说,“许多公司高管将他们进入大模型的尝试描述为实验性的、探索性的,他们还在试图弄清楚这是多大的挑战。”


到目前为止,从大模型浪潮中赚到钱的几乎都是 “买铲子” 的公司。比如英伟达。刚过去的第二财务季度,英伟达 GPU 相关业务营收同比增长 171% 到 103 亿美元,公司净利润同比增长八倍到 62 亿美元。 


这轮政策落地,也可能会让互联网广告平台先赚一笔钱。一名北京大模型从业者说,他们正在等待备案完成,之后将在短视频、搜索平台重新启动产品投放。在此前一段时间各产品主要以测试形态存在时,这家公司认为大规模投入经济上不划算。这之前,它们一度每月的产品广告投流费用达百万元级别。


“现在还没有到出现超级应用的程度。” 一位大模型从业者认为可能还需要两到三年时间,目前只是有了一些迹象,“等到技术能力更强,应用效果够好,成本足够低,真正的超级应用才可能出现。”

朱丽琨对此文亦有贡献。

题图来源:烈火战车 Chariots of Fire

·  FIN  ·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
北京首批5款AI大模型产品通过备案上线;哪吒汽车宣布完成70亿元Crossover轮融资;谷歌云与英伟达深度合作……6月上电影备案:减少59部,《神探大战2》、万玛才旦遗作备案大模型通用层故事基本结束了,应用层机会就会多吗?国内第一批大模型准入资质公布,聊聊海内外大模型创业的近距离观察 |极客周末Xi presents China\'s Friendship Medal to Vietnam\'s communist pa罗地亚奥帕蒂亚(Opatija),海景眺望聊一台性能释放激进的迷你主机2023年境外上市备案破170家,29家完成备案,最新名单大全iPhone 15 系列开启预售 / 华为推出 18K 金智能手表 / 腾讯混元大模型首批通过备案 | 灵感周报中国首批大模型版号发放:百度华为讯飞商汤百川腾讯等11家获准,App小程序直接可用坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大Oakley 又开始让激进的 Rage 小子们「深陷」?多家大模型首批通过备案向公众开放;AI在无人机竞速领域战胜人类冠军;OpenAI有望实现10亿美元年收入|AIGC周观察第十七期9月上电影备案:《长安十二时辰》电影版、吴京公司新武侠电影《刀》通过备案国内首批“合法AI”备案,用户价值却成谜智能周报|OpenAI发布ChatGPT企业版,预计今年营收10亿美元;首批11家国产大模型「获批」,不包括阿里巴巴通义大模型黄浦江》 —— 第9章 王公门庭(1)厨房闲聊------态度和选择国内首批通过备案上线的8款AI大模型产品圣迭戈不眠夜,呵呵十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型境外上市备案新规以来,首家De-SPAC阶段企业获备案通过弗里曼·戴森:激进的科学家 | 中国物理学会期刊网激进的Temu,正经历阵痛大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱官方:降低存量首套房贷款利率;去哪儿补贴员工生育:每孩最高7.7万元;多家大模型首批通过备案向公众开放丨邦早报首批AI大模型获批上线,BATH在列;华为Mate 60开售即火,接入盘古大模型;AI操控无人机能力超越人类冠军丨AI周报5月电影备案:数量增长超90%,《罗小黑战记2》《镖人:风起大漠》备案Model Y 长续航及高性能版降价;苹果考虑激进设计十周年版 Apple Watch;新华社发布国产大模型报告 | 极客早知道国家网信办公布首批26家应用商店备案名单!苹果应用商店未包含在内!附备案流程梳理百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。