大模型通用层故事基本结束了，应用层机会就会多吗？

2023-09-29 04:09

大模型的狂欢结束了

虽然大模型的热度已经持续大半年了，但是很多人对大模型仍然有较大差异的认知。鉴于此，我们先问一下ChatGPT—4什么是AIGC（生成式人工智能）？ChatGPT—4回答道：“通过理解和模仿现有输入数据中的模式、结构和特征，自主生成新颖、高质量和连贯的内容、数据或解决方案，目的通常是为了提高创造力、自动化任务或解决复杂问题。”

那么大模型是什么呢？ChatGPT—4回答大模型本质上是一个使用海量数据训练而成的深度神经网络模型，其巨大的数据和参数规模，实现了智能的涌现，展现出类似人类的智能。

大模型应用效果的基础是高质量的训练数据，这对业务领域训练数据的准备，尤其是认知场景训练数据的准备提出了更高的要求。所以重点来了，需要高质量的训练数据，再加上高昂的算力成本，所以大模型天然就是大公司之间的游戏。

据科技部统计，到今年5月份，中国已发布79个10亿参数规模以上的大模型。如今，根据业内人士估算，目前，国内大模型数量早已逼近200个，甚至有券商报告称，行业正在步入“万模大战”的时代。

一位在近期成立了AIGC基金的投资者表示，大厂的开源免费速度太快，基于此，下半年很多大模型企业势必面临融资难的问题。当然一些比如百川、智谱、Minimax等明星企业除外，实力雄厚也迅速发布自家大模型，并且基本都公开免费商用。

8月31日，包括百度文心一言、智谱清言、商汤SenseChat等多款大模型应用终于拿到了监管部门颁发的首批入场券，可面向普通个人用户提供服务。这是一个关键节点，今年年初开始的大模型公司终于可以在国内向个人用户开放。不要小瞧这些大公司的大模型发布，鉴于目前行业公认仍与ChatGPT—4有一定差距而不是领先，所以问题的关键就在于先发者优势，更为重要的是很多大公司拥有沉淀多年的高质量行业数据，大模型成功的一半因素至少有了。

据《财经十一人》报道，在通用大模型领域中国公司的竞争相对同质化，算法都是基于Transformer。一位长期关注AI的投资人评价，近期资本对大模型的态度明显降温，这是多个原因造成的：一是大模型很贵，能投的机构本身就不多，且已经入局。二是大家发现OpenAI的商业化路径都不够清晰，国内大模型的商业化都还在PPT阶段。

据36氪不完全统计，上半年融到钱的大模型企业大概有20多家，而6月后，数量骤减至不到1/2。一名双币基金的AI投资人终止了四五家大模型企业的投资进程，近期他们只看AI应用。

可惜时至今日，AI赛道依然没有一款“杀手级”应用——市场和投资人都在观望，高开的大模型技术是否能持续高走，给予可观的回报。

出门问问CEO李志飞在一次公开演讲时表示，如果AIGC只能做生成式文本，那将会是互联网史上最巨大的泡沫，但目前来看并不是，多模态赋予了AIGC更多可能性，所以接下来更多的机会在应用层。

应用层机会更多？还是更少？

最新估值290亿美元的OpenAI在发布ChatGPT时就是首先向个人用户开放使用，一位接近OpenAI的人士表示，OpenAI的策略是先通过C端应用，短期内覆盖足够多用户，以实现教育市场、抢占市场占有率的目的。此外，用户量越多，大模型获得的反馈和新数据也越多，能帮助测试其效果和能力，有利于进一步优化，才能在B端实现商业化。

但国内的大模型公司已经率先在B端展开工作，至于中间层（工具层）创新的机会一并被大厂们替代了。从模型上看，百度手握文心系列模型（ERNIE1.0，ERNIE2.0，ERNIE3.0，ERNIE3.0-Titan）和PLATO系列模型（PLATO1，PLATO2，PLATO-XL），均积累多年，且和自家核心业务息息相关。此外，百度还有一个从软件到AI芯片全栈打通的Paddle训练框架生态，其对标PyTorch和TenserFlow，也属国内独家。

在核心业务上，百度在国内牢牢把握着搜索端入口，相比于谷歌则更加从容，不需要应付同行的快速挑战，可以以自己的节奏过渡到“大模型+搜索”的问答搜索业务新模式。同时，基于海量中文数据集沉淀，百度也将获得海量中文问答式搜索反馈数据，该稀缺数据足以让百度巩固和继续扩大在这方面的优势，形成“数据飞轮”效应。

腾讯的HunYuan大模型商业化拓展迅速。HunYuan先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务，通过NLP、CV、跨模态等AI大模型，不仅为业务创造了增量价值而且降低了使用成本。特别是其在广告内容理解、行业特征挖掘、文案创意生成等方面的应用，在为腾讯广告带来大幅GMV提升的同时，也初步验证了大模型的商业化潜力。

2022年9月，达摩院发布阿里巴巴最新通义大模型系列，其打造了国内首个AI统一底座，并构建了通用与专业模型协同的层次化人工智能体系，将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。通义大模型整体架构中，最底层为统一模型底座，通义统一底座中借鉴了人脑模块化设计，以场景为导向灵活拆拔功能模块，实现高效率和高性能。中间基于底座的通用模型层覆盖了通义-M6、通义-AliceMind和通义-视觉，专业模型层深入电商、医疗、娱乐、设计、金融等行业。

但大厂们不会只满足于在B端去赋能，C端还是B端对大厂来说界限并没有那么分明，有这个能力做起来只是顺手的事。阿里做出来了妙鸭相机，百度推出了文心一言，同时还贴心的附上了插件机制，上线了百度搜索、览卷文档、一镜流影等，涵盖了文字到视频到图表。文心一言目前还是苹果官方应用商店免费榜前几名，如果妙鸭相机不是过早尝试收费的话，或许热度还能维持很久。

从国外的经验来看，当前阶段高估值公司业务集中在文本、图像和视频方向。包括Jasper（AI文案/内容创造者）、Lightricks（AI驱动的视觉创意应用）、Mutiny（个性化的网站和营销文案）、 DigitalOwl（AI驱动的医疗记录分析和总结），Writer（AI写作平台），Uizard（AI驱动的设计），Profluent（AI驱动的蛋白质设计），Deepdub（AI驱动的语音配音）和HourOne（视频创作工具），等等。

在移动互联网席卷的泛消费领域，大的市场，已经引起广泛重视，且大厂把持着数据和应用入口，后发先至，颠覆先行者。小的市场，随着市场成熟，同质化内卷严重，利润被挤压，财务模型难以成立。国内2B，受制于付费观念和人效比，且大厂也喜欢亲自下场做机会更少。

那是不是应用层就没法做了，当然不是。壁垒在客户，而不在数据。红杉资本近期发布了《生成式AI的第二幕》的报告，与红杉资本原先设想的不同，应用公司生成的数据并没有创造出无法逾越的壁垒，下一代的基础模型可能会彻底摧毁初创公司生成的任何数据壁垒。相反，工作流程和用户网络似乎正在创造更持久的竞争优势来源。

生成型AI的最大问题不是找不到用例、需求或分发，而是证明其价值。这也是为什么第一幕中的应用，以创纪录的速度获得了用户，但首月用户留存指标（One Month Retention）与日活跃用户/月活跃用户（DAU/MAU）的表现不如现有的互联网应用。

红杉资本认为是时候提升用户体验了，更多的工具已经进入用户界面范式转移的武器库：要改变去年以文本对话为主的交互页面，向Inflection的人声交互或更多模态转变；编辑模式也要从副驾驶模式改为Runway这样的导演模式；越来越复杂的代理系统，能够访问外部工具，帮助自主解决问题；要实现系统范围的优化。

简单来说，红杉的意思是应用层需要提供垂直的不可或缺的深度服务，做好行业适配拥抱客户而不是拥抱数据。

怎么做好应用层

根据IDC数据预测，应用层面的需求，将成为推动大模型及AI市场发展的重要推动力。

据其统计，2021年中国人工智能软件及应用市场规模为51亿美元，2026年将有望达到211亿美元。这个还是基于现在水平的推算，如果按照OpenAI每三四个月迭代计算，其商业化能力恐怕将不可限量。

大模型由于极高的智能化属性和极强的广泛嵌入性，它可以被用作一个非常优质的效率工具，这是非常关键的一点，老是想着被替代如何没有意义。

基于此，大模型在C端的定位理解，就从“替代”变成了“赋能”、“助理”。如何寻找AI大模型应用场景，也就是寻找真实可靠的需求，成了打通行业的任督二脉的关键。

To C方面，我们可以看看Buysmart.ai，基于大模型+自研推荐算法的智能电商购物助手。此外，在我们不够熟悉的领域中，比如摩托车、咖啡机、或电脑组装等商品的选购中，AI买手这一应用的使用价值将进一步放大。在此之前，我们只能通过网络或咨询身边的朋友，来达成相关购买，学习成本极高。

腾讯云智能负责人吴运声表示但如果只是把大模型应用理解成简单的模型选择，那就走了窄门。在大模型配置上，需要经历“需求拆解—模型选择—数据训练—环境部署”四大流程，从业务中来，到业务中去。

需求拆解时，如果对技术理解不深入，就没有办法把问题问到点上，核心需求无法提炼就会导致后续环节步步出错。当需求拆解完毕后，光选择基底模型就要考虑训练数据大小、用户设备配置、预算要求、训练时长等诸多问题。

我们认为目前应用层创新主要分为两类，一类是做垂直应用，比如Jasper（AI文案/内容创造者）、Lightricks（AI驱动的视觉创意应用）、Mutiny（个性化的网站和营销文案）。一类是行业应用，帮助金融、医疗等偏传统行业，构建自己的行业模型，既保证数据安全，又能够提供AIGC赋能。

这种看上去传统的行业才更需要效率工具来提升，巨头通吃的现象在这里很难上演，B端客户除了看重性价比之外还看重服务。不过需要注意的是，这些行业对corner case（极端情况）更为敏感，确定性甚至会是第一位。

写在最后

大模型究竟能否解决典型场景的具体问题，以及模型性能、使用成本、实际效果。企业客户对大模型的能力上限、边界、成本、交付、需求方式都还没有统一认知。还需要一段市场培育和验证。

其实缺少统一认知并不是坏事，这个时候巨头的优势并不明显，率先跑出来的应用可以获得高额的市场溢价。所以大模型的故事并没有结束，真正精彩的才刚刚展开第一幕。

如果你是AIGC相关从业者或者对其相当感兴趣，

请加作者微信，拉你进AI高质量交流群

- END -

大模型进化正在加速，哪些行业正在快速被改变？传统行业如何看清AI的生态价值，重塑业务与组织？AI创业者如何深挖应用场景，落地新技术方案？

首席商业评论联合首钢基金，推出一封来自AGI产业先锋营的共创邀请函欢迎AI方向的创业者，以及希望为产业数智化升级的科技公司创始人合伙人等

参考资料：

解析AIGC应用层来源：ctrl 西

大模型应用层独角兽盘点来源：盐包君

大模型应用时代，百度开了个头来源：晚点财经

大模型要从业务中来，到业务中去来源：硅基研习社

年初疯狂，年末仿徨来源：智能涌现

大模型让AI普惠的前景被看到来源：硅基研习社

国内AI大模型梳理来源：计算机文艺复兴

首批12款大模型拿到入场券来源：财经十一人

华为的“几十万板卡” 来源：未尽研究

最新话题：这个问题比高端芯片还难

欢迎关注“首席商业评论”视频号留言讨论！

投稿及内容合作｜[email protected]
广告及商务合作｜[email protected]

点击“在看”，拥有相互成就的关系！

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章