生成式AI进入第二阶段了

2023-09-22 02:09

知名的投资公司红杉资本在去年发表过一篇名为《Generative AI: A Creative New World》文章，探讨了他们对于生成式AI 的开发。在经过一年的发展之后，红山资本再次发文，在这篇名为《Generative AI’s Act Two》的文章之中，红杉资本回顾了这一年中生成式 AI 市场的变化，以及在当下，他们是如何看待生成式 AI的。

以下为《Generative AI’s Act Two》原文编译：

去年，红杉资本提出了一个假设，生成式AI 将为技术领域带来一场深刻的变革。而这之后不久，AI领域的改变如同狂风暴雨般到来。

长期以来，科学家、历史学家和经济学家一直在创造一个像寒武纪大爆发一样的环境的最佳条件。而在生成式AI领域，我们已经创造了一个现代奇迹，就如同我们这一代人的太空竞赛一样。

这一时刻已经酝酿了几十年。摩尔定律用六十年的时间为我们提供了处理浮点数据的计算能力。而现代护理网花了四十年的时间为我们提供了数万亿 Token的训练数据。二十年的移动计算和云计算时代让每个人都拥有了能放在手中的超级计算机。数十年的技术进步积累为生成式AI的腾飞创造了必要条件。

ChatGPT 的崛起是点燃导火索的火花，它释放出的创新密度和热情是我们多年来从未见过的，甚至可以说是从互联网诞生之初便从外出现。这种令人窒息的兴奋在脑谷尤为明显，在那里，AI研究人员获得了如同摇滚明星的地位，每个周末都有新的自主代理机器人（（Agent））和陪伴聊天机器人出现在黑客家中。AI研究人员从“住在车库里的黑客”变为指挥数十亿美元计算的特种部队。arXiv 上的相关论文也变得越来越多，以至于研究人员开玩笑地呼吁暂停发表新论文，让人们赶上进度。

很快地，人们对应用于AI的兴奋就变成了近乎歇斯底里的狂热。一时之间，每家公司都成了 "AI助手”。每个人的收件箱里都塞满了 "AI Salesforce"、"AI Adobe 和 "AI Instagram 的无差别推销。1亿美元的产品前种子轮融资又回来了。我们发现自己陷入了难以为继地筹资、人才争夺战和 GPU 采购狂潮之中。

与此同时，AI带来的争议开始显现。艺术家、作家和歌手对AI 生成内容的合法性提出了质疑。关于道德、监管和迫在眉睫的超级智能的争论席卷华盛顿。而最令人担忧的是，硅谷内部也开始流传一种说法，成 AI 实际上并没有任何用处，产品远未达到预期的效果，糟糕的用户留存率证明了这一点。用户对许多应用的需求开始趋于平稳。这是否又是一个虚无缥缈的周期？

AI的不满之夏让许多批评家们大为兴奋，这种情况不禁让人想起了互联网早期时代。在1998 年，一位著名的经济学家曾宣称：到 2005 年，互联网对经济的影响显然不会超过传真机。

但我们必须要说，尽管充满了吵闹、歇斯底里，充满了不确定性和不满情绪，生成式AI的起步已经比 SaaS 要成功得多。仅初创企业的收入就超过了 10 亿美元，而SaaS 市场达到这一规模花费了数年的时间。

一些应用程序已经家喻户晓：ChatGPT 成为增长最快的应用，在学生和开发者中具有特别强的产品－市场契合度；Midjourney 成为集体创作的缪斯，仅靠 11 人的团队就实现了数亿美元的收入；Character 普及了AI娱乐和陪伴，创造了我们最渴望的消费者社交应用，用户在应用内平均花费两小时。

不过这些早期成功的迹象并不能改变这样一个现实：很多AI公司根本没有产品与市场的契合点，也没有可持续的竞争优势，AI生态系统的整体繁荣当前仍然是不可持续的。

现在一切已尘埃落定，我们认为这是一个合适的时机来放大并反思生成式AI：它现在所处的位置，以及未来可能的方向。

｜进入第二幕

生成式AI走入人们眼中的第一幕是从技术开始的。我们发现了一个新的锤子：基础模型，并推出了一大波新奇的应用程序，向人们展示了一个很酷的技术。

而现在，我们相信市场正在进入第二幕：从用户出发。第二幕将从头到尾解决人类的问题。这些应用在本质上不同于第一代应用，它们倾向于使用基础模型作为更全面解决方案的一部分，而不是整个的解决方案。它们引入了新的编辑界面，使工作流程更有黏性，输出效果更好，而且它们通常是多模式的。

市场已经开始从第一幕向第二幕过渡。进入第二阶段的公司包括：为精英律师事务所定制大语言模型的哈维公司（Harvey）；为我们的工作空间建立爬行和索引，使生成式AI与工作更加相关的 Glean 公司；以及正在创建数字伴侣的 Character 和 Ava 公司。

为此，我们更新的生成式AI市场地图。

与去年发表的地图不同，我们选择按使用案例而不是模型模式来绘制这张地图。这反映了市场的两个重要趋势：生成式AI从技术锤炼到实际用例和价值的演变，以及生成式AI应用越来越多的多模态性质。

此外，我们还绘制了一张包含了一个大语言模型开发人员堆栈的图片，它反映了公司在生产中构建生成式AI应用时所求助的算力和工具供应商。

在去年的文章之中，我们提出了生成式AI市场机遇的论点，并假设了市场将如何发展。而经过这一年发展，让我们来看看我们的文昌存在哪些问题，

首先是我们预测错误的地方：

1. 技术发展的速度超乎想象。去年，我们预计需要近十年的时间大模型技术才能实现内部代码生成、好莱坞品质的视频或者是听起来不机械的人类语音。但现在，只要听一听 Eleven Labs 在 TikTok 或 Runway 的AI电影节上的声音，就会清楚地意识到未来已经飞速到来。就连 3D 模型、游戏和音乐也在迅速变得优秀。

2. 供应链存在瓶颈问题。我们没有预料到最终用户的需求会在多大程度上超过 GPU 的供应。许多公司的增长瓶颈问题不是客户需求，而是如何获得 Nvidia 的最新 GPU。漫长的等待时间已经成为常态，于是出现了一种简单的商业模式：开发只要支付订阅费，就可以不用排队，获得更好的型号的GPU。

3. 垂直分离尚未发生。我们仍然相信，应用层公司和基础模型提供商之间会出现分离，模型公司专注于基础模型规模和研究，而应用层公司则专注于产品和用户界面。实际上，这种分离还没有完全实现。很多1成功的面向用户的应用程序都是垂直整合的。

4. 残酷的竞争环境和大公司的迅速反应。去年，大模型市场中虽然出现了一些过度拥挤的类别（尤其是图像生成和文案写作领域），但总体而言，市场还是一片空白。而如今，各个公司之间的竞争越来越激烈。从谷歌的 Duet 、 Bard 到 Adobe 的 Firefly，大型公司的迅速反应以及他们愿意承担风险的决心放大了竞争的激烈度。即使是在基础模型；魔鬼，我们也看到客户正在建立自己的基础架构，以便在不同供应商之间互不干扰。

5. 壁垒出现在客户之中，而非数据。我们曾预测，最好的生成式AI公司可以通过数据飞轮产生可持续的竞争优势，即更多的使用人数带来更多的数据，从而研发出更好的模，吸引更多用户使用。虽然这在某种程度上仍然是正确的，尤其是在那些拥有非常专业和难以获取的数据的领域，但数据壁垒的基础并不稳固：应用公司生成的数据并不能形成不可逾越的护城河，而下一代基础模型很可能会抹去初创公司生成的任何数据护城河。相反，工作流和用户网络似乎正在创造更持久的竞争优势。

除了这些错误的部分，还有一些正确的预测：

1. 生成式AI是个新事物。突然之间，每个开发者都在开发生成式AI应用，每个企业买家都在寻求这种应用。市场甚至保留了生成式AI 的名称。人才流入市场，风险资本也纷纷涌入。生成式AI甚至在病毒视频中成为一种流行文化现象，像是巴黎世家版《哈利波特》或是由幽灵作者创作的模仿 Drake 的歌曲 "Heart on My Sleeve这样的歌曲，这首歌已成为排行榜上的大热歌曲。

2. 第一批杀手级应用出现。有资料显示，ChatGPT 是最快达到 1 亿 MAU 的应用，而且只用了 6 周时间。相比之下，Instagram 用了 2.5 年，WhatsApp 用了 3.5 年，YouTube 和 Facebook 用了 4 年才达到这规模。但 ChatGPT 并不是一个孤立的现象。Character AI 的深度参与（平均会话时间为 2 小时）、Github Copilot 的生产力优势（效率提高 55%）以及 Midjourney 的货币化路径（数亿美元的收入）都表明，第一批杀手级应用已经到来。

3. 开发者成为关键。像Stripe 和 Unity 这样以开发人员为中心的公司发现，开发者们已经创造了许多人无法想象的案例。在过去的几个季度中，从音乐生成社区到AI媒人，再到AI客户支持代理，我们已经接触到了各种各样的AI产品。

4. AI生态城的形态正在演变。AI应用的最初版本大多是自动完成的，但现在这些形式因素正变得越来越复杂。Midjourney 引入的摄像头平移和填充功能很好地说明了生成式AI给用户的体验是如何变得更加丰富的。从整体上看，形式因素正在从个人生产力向系统级生产力发展。

5. 版权、伦理以及AI带来的就业压力。关于这些问题的争论这一年来此起彼伏。许多艺术家、作家和音乐家们都持有不同的意见，一些创作者对他人利用衍生作品牟利感到愤怒，而一些创作者则对新的AI世界表示欢迎。没有一家初创公司愿意成为 Napster 或 Limewire，而不是最终的 Spotify。与此同时，关于AI生成内容的规则也非常模糊，比如说，在日本，用于训练AI的内容是没有知识产权的，而欧洲已经提议下重手进行监管。

｜生成式AI 处于什么位置？生成式AI的价值问题

生成式AI并不缺乏应用案例或客户需求。用户渴望AI能让他们的工作变得更轻松，让他们的工作效率变得更好，这就是为什么他们会以创纪录的速度涌向各种应用的原因（尽管缺乏自然分布）。

但有多少人会持续使用这些应用？我们比较了AI优先应用与现有移动应用首月留存率，并得出了下图的结果。

研究显示，生成式 AI 应用的留存率并不高。一些恩门消费类公司的 DAU/MAU 为 60%-65%；WhatsApp 的 DAU/MAU 为 85%。相比之下，生成式AI应用程序的留存率中位数仅为 14%。这意味着，用户还没有发现生成式AI产品的价值，以至于每天都要使用它们。

简而言之，生成式AI最大的问题不是寻找用例、需求或分配，而是证明其价值。正如我们的同事David Cahn在文章中所写的那样：2000 亿美元的问题是：你打算用这些基础设施来做什么？它将如何改变人们的生活？要想建立持久的业务，就必须解决客户留存问题，为客户创造足够深的价值，使他们坚持使用并成为每日活跃用户。

我们不要绝望。生成式AI仍处于尴尬的青少年时期”。当产品未能达到预期时，失败往往是可靠的、可重复的和可修复的，这说明我们还有很多的工作要做。

｜第二幕：共享的AI玩家手册

创始人们正着手进行艰苦的提示词工程、微调和数据集整理工作，以使他们的AI产品变得更好。他们正一砖一瓦地将华而不实的PPT打造成完整的产品。与此同时，基础模型研发者们正继续进行着研究和创新。

随着企业摸索出通往持久价值的道路，一本共享的游戏手册正在形成。现在，我们拥有了让模型发挥作用的共享技术，以及将塑造生成式AI第二幕的新兴用户界面范例。

模型开发堆栈

1. 新型推理技术：思维链、思维树和反思等新兴推理技术正在提高模型执行更丰富、更复杂推理任务的能力，同时缩小客户预期与模型能力之间的差距。开发人员正在使用 Langchain 等框架来调用和调试更复杂的多链序列。

2. 迁移学习技术：像 RLHF 和微调这样的迁移学习技术正变得越来越简单，特别是最近 GPT-3.5 和 Llama-2 的微调技术推出，许多公司可以根据其特定领域调整基础模型，并根据用户反馈进行改进。开发人员正在从 Hugging Face 下载开源模型，并对其进行微调，以实现高质量的性能。

3. 检索增强生成正在引入有关企业或用户的上下文，以减少大模型的幻觉问题，提高真实性和实用性。Pinecone 等公司的矢量数据库已成为 RAG 的基础架构支柱。

4. 新的开发者工具和应用框架为公司提供了可重复使用的构件，以创建更先进的AI应用，并帮助开发者评估、改进和监控生产中AI模型的性能，包括LLMOps工具，如Langsmith和Weights & Biases。

5. Coreweave、Lambda Labs、Foundry、Replicate 和 Modal 等AI优先的基础设施公司正在为公有云松绑，并提供AI公司最需要的东西：以合理的成本提供大量 GPU，按需提供，可高度扩展，并提供良好的 PaaS 开发人员体验。

随着底层基础模型的不断改进，这些技术应该能缩小模型的期望与现实之间的差距。但是，模型的完善只是成功的一半。以AI为先的生成式用户体验的玩法也在不断演变：

新兴产品蓝图

1. 生成式界面。基于文本的对话式用户体验是 LLM 的默认界面。从 Perplexity 的生成式用户界面到 Inflection AI 的人声等新模式，更新的形式因素正逐渐进入这一领域。

2. 新的编辑体验：从 "AI助手到导演模式”。随着我们从零拍摄（zero-shot）向要求－调整（ask-and-adjust）转变（ht/t Zach Lloyd），生成式AI公司正在发明一系列新的旋钮和开关，让让传统的剪辑工作流变得成截然不同。Midjourney 的新平移命令和 Runway 的导演模式创造了类似摄像机的全新剪辑体验。而Eleven Labs 正在实现通过提示词来生成音频。

3. 日益复杂的代理系统。生成式AI 应用不再是自动完成或供人类审阅的初稿；它们现在能够自主解决问题、访问外部工具并代表我们端到端的解决问题。我们正在从 0 级自主稳步向 5 级自主迈进。

4. 全系统优化；有些公司并没有将系统嵌入到单个用户的工作流程中，从而提高该用户的效率，而是直接解决全系统优化问题。你能否挑出一大块支持票据或拉动请求，并自主解决它们，从而使整个系统更有效率？

｜写在最后

随着前沿悖论的临近，随着Transforrmers和扩散模型的新鲜感逐渐消退，生成式AI市场的性质也在不断发生变。炒作和噱头正在让位于生成式AI真正的价值和完整的产品体验。

在红杉，我们仍然是生成式AI的坚定信仰者。让这个市场起飞的必要条件已经积累了几十年，而现在，爆发的市场终于到来。杀手级应用的出现和终端用户的巨大需求加深了我们对市场的信心。

然而，阿马拉定律（人们总是高估一项科技所带来的短期效益，却又低估它的长期影响）现在正在发挥作用。我们在做出投资决策时要有耐心和判断力，仔细研究创始人是如何解决价值问题的。各个公司们正在使用共同的游戏规则来推动模型性能和产品体验的发展，这让我们对生成式AI的第二幕充满信心。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章