李志飞带着大模型「序列猴子」来了：能力自测略低于GPT3.5

2023-04-20 14:04

机器之心报道

编辑：李亚洲、蛋酱

李志飞表示：经过测试，个人觉得自家大模型能够达到 GPT-4 一半的水平，略低于 GPT3.5。

大模型，绝对是当前整个科技领域的「皇冠明珠」。

自 OpenAI 发布 ChatGPT 以来，全球科技公司都开始了大模型技术抢滩之战。国外，微软、谷歌的竞争态势越来越激烈，不久之前亚马逊也发布 Titan 大模型入局这场战争。AI 社区也逐渐形成了基于大模型的生态，包括 AutoGPT 等产品。

而国内，经过小半年的酝酿，百度、阿里已经发布自己可以对标 OpenAI 的大模型，也有一批创业公司推出了自己的类 ChatGPT 产品。

早在 ChatGPT 爆火初期，出门问问创始人、CEO 李志飞就是高调入局 ChatGPT 的创业者之一，曾宣称要做中国的 OpenAI。

Talk is Cheap。今天，李志飞带着出门问问的自研大模型「序列猴子」登场，并基于「序列猴子」推出 AI 写作平台、AI 图片生成平台等多个 AIGC 产品。

「序列猴子」大模型

作为 ChatGPT 的拥趸者，李志飞首先表示，ChatGPT 的出现让其深刻认识到 AGI 时代的到来，而大模型是目前看起来通往 AGI 的最靠谱的实现方式。

对于大模型，李志飞提出了两种观点：

第一，大模型是一个序列模型。「今天的大模型让我觉得特别有潜力，因为它学会了快速学习一个序列。而今天的序列模型可以去做结构化建模，一旦拥有了这种方法论，我们就可以用它来做很多别的事情。」

第二，大模型是一个认知模型。「今天我们训练大模型用到的互联网文本其实是世界知识的映射，所以 GPT 远不止是生成一个文章，它还有自己的知识和逻辑。如果大家把大模型看成是一个认知模型，想象空间是非常大的。」

基于过去数年在大模型、AIGC 领域的技术沉淀，今天，出门问问新一代大模型「序列猴子」终于面世。它的参数量在几百亿规模，目前具备语言、知识、逻辑、数学和推理能力，还有面向简单问题的规划能力。

为什么叫做「序列猴子」？相信大家第一次看到这个名字的时候都会感到好奇。

李志飞提到，数学家埃米尔・博雷尔在 20 世纪初提出了一个名叫「无限猴子」的定理。该定理描述了：如果一只猴子随机地敲打打字机，只要给予无限时间，几乎必然能够打出任何文字，比如莎士比亚的《哈姆雷特》。

出门问问这个大模型名字的寓意与「无限猴子」类似。同理，如果喂给机器猴子海量的文本序列，通过大规模算力的训练，它就会成为智能的「序列猴子」。

从过去这段时间的训练情况来看，李志飞表示，「序列猴子」在训练过程中已经展现出了「涌现」能力，目前正处于「顿悟」阶段，未来提升的速度会越来越快。

李志飞现场实测：没翻车

「序列猴子」到底怎么样？李志飞来了一场台上演示，且是那种真实的现场测试：

首先是一些常识问答：

目前来看，「序列猴子」能够完成简单的逻辑推理。

输入「我现在餐厅点菜，它们有辣子鸡、蛋花汤、清炒空心菜、水煮基围虾、石磨豆腐，我不喜欢吃辣的，但喜欢吃虾，帮推荐三个菜吧」，结果是：

接下来是一道数学逻辑题：

根据不同的设定条件，序列猴子可以给出不同的回答：

然后是阅读理解。为了考验序列猴子的阅读理解与多轮对话的能力。李志飞让张鹏替代他的角色，与序列猴子进行了多轮对话。在这个过程中，序列猴子都从之前的对话信息中准确提取出了新公司与旧公司的名称。

还可以再加一点难度，比如这个：

从图中也可以看出，「序列猴子」有着清晰的推理过程。

「序列猴子」和之前的对话式大模型相比如何？李志飞表示，经过测试，他觉得自家大模型能够达到 GPT-4 一半的水平，略低于 GPT3.5。

基于「序列猴子」的 AIGC 产品矩阵

虽然如今一大批科技巨头、创业公司争相发布自家的通用人工智能大模型，但最终要考虑的问题还是如何落在应用与产品上。因此出门问问也要打造面向创作者的 Copilot。

伴随着自家大模型的露相，出门问问也发布了基于「序列猴子」的多项 AIGC 产品，包括写作应用「奇妙文」、绘画应用「言之画」、AI 声音平台「魔音工坊」、数字人视频制作与直播平台「奇妙元」。

李志飞表示，在未来，Copilot 将会无处不在。此外，没有一个行业不会受到 AGI 的影响。

在发布会之前，机器之心简单体验了下奇妙文。

面向专业的文字内容生产领域，奇妙文特别设置了「市场营销」、「职场办公」、「新媒体」、「创意写作」四大版块。

试用网址：wen.mobvoi.com

既然能写新闻稿，机器之心就尝试让它写下今天的发布会：

输入：「出门问问 CEO 李志飞今天发布「序列猴子」大模型，写一篇新闻稿。」生成结果还不错。

此外，我们可以看到，针对每次生成的内容，奇妙文可以进行重试、续写、改写、风格转换、纠错甚至 AI 配图等一系列操作。

目前，「奇妙文」等应用已经开启了内测，感兴趣的读者可以去体验下。

随后，面向 C 端的出门问问语音助手「小问」也在这场活动上宣布了最新升级。这款个人 AI 助理最早诞生于十年前，升级之后，今天内测的「CoPilot - 魔法小问」添加了问答推荐、图像生成等新功能，仍可通过语音唤醒，类似于「Siri 与 ChatGPT 的结合体」。

面向 B 端，出门问问也开展了企业专属大模型的内测探索。基于「序列猴子」的能力，不同行业的企业都可以拥有定制化的对话式大模型。

最后，对于「序列猴子」，你有什么看法？

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章