C轮融资1.55亿美元,谷歌、英伟达参投,为什么它会是OpenAI、Cohere最大对手?
这家公司生成式 AI 最吸引人的地方可以概括为三个关键词:准确、值得信赖且可靠。
AI21 Labs 经常被认为是 OpenAI 的竞争对手,也是最早将生成式 AI 推向大众的机构之一。
8 月 31 日,这家位于以色列特拉维夫大语言模型 ( LLM ) 初创公司宣布完成 1.55 亿美元的 C 轮融资。新一轮融资后,公司估值达 14 亿美元。
投资者包括 Walden Catalyst、Pitango、SCB10X、b2venture、Samsung Next 和 Amnon Shashua(Mobileye 创始人),谷歌和英伟达也参与其中。
透过英伟达 CEO 黄仁勋对媒体的发言,我们可以将这家公司生成式 AI 最吸引人的地方概括为三个关键词:
准确、值得信赖且可靠。
8 月,公司入选了今年首个 CB Insights GenAI 50 榜单,与 Open AI、Cohere 同位于基石模型阵列。
AI21 Labs 由 Mobileye 创始人 Amnon Shasuha、Yoav Shoham 和 Ori Goshen 于 2017 年创立。
Amnon Shashua 曾在以色列希伯来大学计算机系任教,专注研究计算机视觉科学,是全球知名的人工智能专家。他创立并领导着四家 AI 公司:Mobileye、OrCam、AI21 Labs 以及以色列首家数字银行 One Zero。
Yoav Shoham 是斯坦福大学的名誉教授(已经从斯坦福大学退休),曾将两家公司卖给了谷歌。
Ori Goshen(CEO)是一位连续创业者,共同创立并领导了几家以色列科技公司。曾在著名的以色列国防军 8200 技术部队工作。
三位联合创始人Amnon Shasuha(左)、Yoav Shoham (右) 和 Ori Goshen (中)
3 月,AI21 Labs 发布了最新大语言模型 Jurassic-2,但未透露模型参数大小,因为规模「是一个因素,但不是唯一的因素。」
但这不妨碍我们参照一下 Jurassic-2 的前身 Jurassic-1:
它最大的版本拥有 1780 亿个参数,这也使它成为市面上最大 LLM 之一 ,比 OpenAI 的 GPT-3 davinci 还大一点,后者参数规模是 1750 亿。
与前一代相比,Jurassic-2 响应时间提高了 30%,也提供更多语言服务。那么,Jurassic-2 与 OpenAI、Cohere 和 Anthropic 等大模型到底有什么不同呢?
首先,方向不一样。CEO Ori Goshen 曾说,AI21 专注于 「阅读和写作相关用例」,并不关心生成 AI 在写代码或任何其他会话用例中的应用。
其次,为了应对 LLM 容易出错、幻觉等问题,他们尝试「用一种额外的方法来增强和补充 LLM,以弥补可靠性和可解释性的不足。」
例如,他们提出了一种系统 「MRKL Systems 」,将一个或多个 LLM 与「外部知识来源」以及符号推理专家系统结合起来,后者可以处理那些神经网络模型无法处理的任务。
这种架构被称为「神经符号架构」,其中,语言模型将一些任务卸载到专门用于执行特定任务的模块上。比如,将算术交给特殊的模块,而不是让 LLM 根据统计概率「预测」答案。通过添加这些模块,来「弥补纯语言模型的脆弱性」。
据媒体报道,AI21 Labs 在 2022 年实现了 2000 万美元的收入,并且预计今年收入将达到 5000 万美元。公司一部分收入正是来自出售 Jurassic 的访问权限,在与 OpenAI 和 Anthropic 等大型竞争对手的软件竞赛中独占一席之地。
和 Jurassic-1 一样,Jurassic-2 也透过公司旗舰产品——一个开发平台 AI21 Studio ——提供给开发人员。AI21 Studio 于 2021 年 8 月推出,提供 Jurassic-1 语言模型 API 访问以及自定义模型开发服务。
除了可以创建虚拟助手、聊天机器人、内容审核工具等,开发者还可以透过平台的「即用即付」服务,申请访问根据其要求而微调数据集的自定义模型。
据报道,目前有超过 35,000 名开发人员注册了 AI21 Studio 。
AI21 Labs提供一系列调优参数来自定义其语言模型的输出,范围从小型,快速模型到更大,更复杂的产品。
Jurassic-2 提供三种尺寸的 LLM 服务(类似星巴克「特大杯、大杯、中杯」)。除了直接使用三种 LLM 模型中的任何一种,他们还推出了五个针对特定任务的 API :释义,摘要,文本建议,语法纠错和文本分割(长文本分段)。
每个 API 都会连接到某个 LLM 专用版本。例如,摘要模型「接受了大量摘要的训练」,使用了针对摘要进行优化的算法。这些任务模型往往比 LLM 小得多,也更准确,不太容易像 LLM 那样出现幻觉。
Jurassic-2 五个新AI生成工具API:释义,摘要,文本建议,语法纠错和文本分割。
除了出售 Jurassic 访问权限,公司大部分收入来自 Wordtune——一款面向消费者的 AI 写作助手。Wordtune 目前拥有超过 1000 万用户,订阅价格也不便宜。
早在 2020 年 10 月 ,AI21 Labs 就推出了自己第一款产品 Wordtune,类似 Grammarly ,能理解文本的上下文和语义,帮助非英语母语人士找到正确的单词和表达方式,还可以帮助扩写和缩写句子。
谷歌曾将 Wordtune 评为 2021 年最受欢迎扩展程序之一。后来,他们又为 Wordtune 推出了 AI 文本分析和摘要功能 Wordtune Read,可以迅速识别复杂文档里的关键信息和主题。
2023 年 1 月 17 日,AI21 Labs 又推出 Wordtune Spices,这是一种生成 AI 工具,提供了十几种增强写作能力的办法。
例如,「重写」 会为你提供不同的改写建议:调整一下顺序?变换一下语气还是替换一些单词?或者将句子变短或变长?
还有一些更有趣的生成能力。比如,建议提供解释和理由,让主要论点和事实更有说服力;提供统计数据和历史事实,以增强内容。甚至能讲一些冷笑话,让文章更吸引人。比如,「鱼游到墙上的时候说了什么?」,「大坝」。
任何想要改进文本的人都可以使用 Wordtune Spices,包括学者,博主,书籍作家,甚至是法律和医疗工作区的专业人士。
与 ChatGPT 和类似的软件不同,Spices 并不是一个开放式系统。
前者需要用户学习如何写一个好的 prompt,然后就能收到一篇完整的文章。用户几乎无法控制结果,尽管它们并不总是作者想要的东西。
与之相反,Spices 要求用户自己写句子,然后提供各种功能辅助。它更像是一个增强(而不是替代)软件,帮助作者思考,拓展思路,增强文笔能力,写出真正反映其独特风格和需求的内容。
Spices 正试图取得某种平衡:可以帮助用户写作,但又不能代替他们,用户可以控制自己的内容。
另外,Spices 还有一个很重要的特点:在某些情况下,它会链接到一个网页,以显示其信息的来源。比如,建议涉及一些统计数据、历史事实,这些内容到底出自哪里?新闻?维基百科还是其他在线资源?用户点击链接即可查询。
LLM 生成的文本时,经常包含事实错误或不一致之处,特别是针对未接受过训练的最新信息时,为此 AI21 Labs 提出了一种检索增强语言建模(RALM)方法,可以用现成的外部信息源补充现有语言模型,将必要的文件作为输入添加到语言模型中,同时,底层 LM 体系结构不会受到影响。
这家公司希望可以重构人们的读写方式,朝向更美好的未来
谷歌、亚马逊云还有微软提供的工具可与 AI21 Studio 相媲美,Cohere、OpenAI 和 Anthropic 等初创公司也是如此(在较小程度上,Jasper、Regie 和 Typeface 等以营销为重点的供应商也是如此)。
AI21 Labs 则试图通过提供比其他初创公司更小、运行成本更低但输出更可靠的模型来实现差异化。Goshen 之前曾表示,模型的大小并不代表一切,更重要的是模型能提供准确的信息。
我们的大模型是在「一些世界上最大,最复杂的大型语言模型」上开发的,并提供比市场上许多生成 AI 应用程序「更精细的控制」。AI21 在官网上写道。
此外,它们在最新数据上进行训练,这与在旧数据上训练的文本生成模型不同,后者无法准确回答有关当前事件的问题。
「AI21的 AI 系统易于集成,并产生可靠,值得信赖和准确的结果。」
过去一年里,他们也在商业领域追赶 OpenAI 等对手,也在与不同行业的客户合作,包括家乐福、科睿唯安、eBay、Guesty、Monday.com 和育碧。
AI21 Labs 也在继续建立其C-Suite,最近聘请了前 Google 和 Databricks 高管 Pankaj Dugar 担任其上市高级副总裁和北美总经理。
微信扫码关注该文公众号作者