Redian新闻
>
李志飞带着大模型「序列猴子」来了:能力自测略低于GPT3.5

李志飞带着大模型「序列猴子」来了:能力自测略低于GPT3.5

科技

机器之心报道

编辑:李亚洲、蛋酱

李志飞表示:经过测试,个人觉得自家大模型能够达到 GPT-4 一半的水平,略低于 GPT3.5。


大模型,绝对是当前整个科技领域的「皇冠明珠」。


自 OpenAI 发布 ChatGPT 以来,全球科技公司都开始了大模型技术抢滩之战。国外,微软、谷歌的竞争态势越来越激烈,不久之前亚马逊也发布 Titan 大模型入局这场战争。AI 社区也逐渐形成了基于大模型的生态,包括 AutoGPT 等产品。


而国内,经过小半年的酝酿,百度、阿里已经发布自己可以对标 OpenAI 的大模型,也有一批创业公司推出了自己的类 ChatGPT 产品。


早在 ChatGPT 爆火初期,出门问问创始人、CEO 李志飞就是高调入局 ChatGPT 的创业者之一,曾宣称要做中国的 OpenAI。


Talk is Cheap。今天,李志飞带着出门问问的自研大模型「序列猴子」登场,并基于「序列猴子」推出 AI 写作平台、AI 图片生成平台等多个 AIGC 产品。


「序列猴子」大模型


作为 ChatGPT 的拥趸者,李志飞首先表示,ChatGPT 的出现让其深刻认识到 AGI 时代的到来,而大模型是目前看起来通往 AGI 的最靠谱的实现方式。


对于大模型,李志飞提出了两种观点:


第一,大模型是一个序列模型。「今天的大模型让我觉得特别有潜力,因为它学会了快速学习一个序列。而今天的序列模型可以去做结构化建模,一旦拥有了这种方法论,我们就可以用它来做很多别的事情。」


第二,大模型是一个认知模型。「今天我们训练大模型用到的互联网文本其实是世界知识的映射,所以 GPT 远不止是生成一个文章,它还有自己的知识和逻辑。如果大家把大模型看成是一个认知模型,想象空间是非常大的。」


基于过去数年在大模型、AIGC 领域的技术沉淀,今天,出门问问新一代大模型「序列猴子」终于面世。它的参数量在几百亿规模,目前具备语言、知识、逻辑、数学和推理能力,还有面向简单问题的规划能力。


为什么叫做「序列猴子」?相信大家第一次看到这个名字的时候都会感到好奇。


李志飞提到,数学家埃米尔・博雷尔在 20 世纪初提出了一个名叫「无限猴子」的定理。该定理描述了:如果一只猴子随机地敲打打字机,只要给予无限时间,几乎必然能够打出任何文字,比如莎士比亚的《哈姆雷特》。


出门问问这个大模型名字的寓意与「无限猴子」类似。同理,如果喂给机器猴子海量的文本序列,通过大规模算力的训练,它就会成为智能的「序列猴子」。


从过去这段时间的训练情况来看,李志飞表示,「序列猴子」在训练过程中已经展现出了「涌现」能力,目前正处于「顿悟」阶段,未来提升的速度会越来越快。


李志飞现场实测:没翻车


「序列猴子」到底怎么样?李志飞来了一场台上演示,且是那种真实的现场测试:


首先是一些常识问答:


目前来看,「序列猴子」能够完成简单的逻辑推理。


输入「我现在餐厅点菜,它们有辣子鸡、蛋花汤、清炒空心菜、水煮基围虾、石磨豆腐,我不喜欢吃辣的,但喜欢吃虾,帮推荐三个菜吧」,结果是:


接下来是一道数学逻辑题:


根据不同的设定条件,序列猴子可以给出不同的回答:


然后是阅读理解。为了考验序列猴子的阅读理解与多轮对话的能力。李志飞让张鹏替代他的角色,与序列猴子进行了多轮对话。在这个过程中,序列猴子都从之前的对话信息中准确提取出了新公司与旧公司的名称。


还可以再加一点难度,比如这个:


从图中也可以看出,「序列猴子」有着清晰的推理过程。


「序列猴子」和之前的对话式大模型相比如何?李志飞表示,经过测试,他觉得自家大模型能够达到 GPT-4 一半的水平,略低于 GPT3.5。


基于「序列猴子」的 AIGC 产品矩阵


虽然如今一大批科技巨头、创业公司争相发布自家的通用人工智能大模型,但最终要考虑的问题还是如何落在应用与产品上。因此出门问问也要打造面向创作者的 Copilot。


伴随着自家大模型的露相,出门问问也发布了基于「序列猴子」的多项 AIGC 产品,包括写作应用「奇妙文」、绘画应用「言之画」、AI 声音平台「魔音工坊」、数字人视频制作与直播平台「奇妙元」。


李志飞表示,在未来,Copilot 将会无处不在。此外,没有一个行业不会受到 AGI 的影响。


在发布会之前,机器之心简单体验了下奇妙文。


面向专业的文字内容生产领域,奇妙文特别设置了「市场营销」、「职场办公」、「新媒体」、「创意写作」四大版块。


试用网址:wen.mobvoi.com


既然能写新闻稿,机器之心就尝试让它写下今天的发布会:


输入:「出门问问 CEO 李志飞今天发布「序列猴子」大模型,写一篇新闻稿。」生成结果还不错。


此外,我们可以看到,针对每次生成的内容,奇妙文可以进行重试、续写、改写、风格转换、纠错甚至 AI 配图等一系列操作。


目前,「奇妙文」等应用已经开启了内测,感兴趣的读者可以去体验下。


随后,面向 C 端的出门问问语音助手「小问」也在这场活动上宣布了最新升级。这款个人 AI 助理最早诞生于十年前,升级之后,今天内测的「CoPilot - 魔法小问」添加了问答推荐、图像生成等新功能,仍可通过语音唤醒,类似于「Siri 与 ChatGPT 的结合体」。


面向 B 端,出门问问也开展了企业专属大模型的内测探索。基于「序列猴子」的能力,不同行业的企业都可以拥有定制化的对话式大模型。


最后,对于「序列猴子」,你有什么看法?


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
开源版ChatGPT来了?多数任务效果超越GPT3,已开源!李志飞:关于GPT-4的八点观察,多模态大模型竞赛开始GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火李志飞劝各位冷静点:通用大模型创业不一定适合所有人,包括大佬们宾州新希望小城(New Hope),街头扫描GPT-5将死于GPT-4背刺?牛津剑桥研究警告:AI训AI成「剧毒」,会让模型崩溃!甲小姐对话李志飞:聊聊这场疯狂的AI大模型炼丹大会 | 甲子光年开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT李志飞退回出门问问,“拖家带口”能做好大模型吗?300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了对话李志飞:大模型的关键在于如何把大模型用起来|年度AI对话2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载自然感染新冠免疫力究竟如何呢?只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型豪斯曼:《诗歌外编》: 第十五首:已经五年了,“到了尽头,”我说重磅!基于GPT-4的全新智能编程助手 GitHub Copilot X 来了!刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此最新RLHF拯救语言模型「胡说八道」!微调效果比ChatGPT更好,两名华人共同一作Sam Altman、Hinton中国首秀!国内最硬核AI内行盛会圆满闭幕,国产大模型「悟道3.0」全面开源猴子骂谁?非裔女大闹唐人街美甲店,“他X的中国人,猴子!”检方居然取消了指控!!!OpenAI发布GPT-4:能识图能算税,ChatGPT摆脱Chat,再次进化成本不到100美元!UC伯克利再开源类ChatGPT模型「考拉」:数据量大没有用,高质量才是王道葡萄牙圣维森特德福拉修道院,17世纪建筑Vision Pro 开发套件开放申请;《黑镜》主创曾试 ChatGPT 写剧本;千亿级参数大模型「书生·浦语」发布|极客早知道苦难与依托单GPU实现99%ChatGPT性能,「原驼」火了:手机也能微调大模型阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl「滚出美国!你个猴子」华女当街被群骂仇视言论网上被疯传...如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍动态丨李志飞退回出门问问,“拖家带口”能做好大模型吗?GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升国产ChatGPT「序列猴子」全网首测!在线体验不用等,画苏联马斯克超逼真开源版ChatGPT,30分钟训完,性能堪比GPT3.5!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此来了!关于GPT最牛的一本书,比尔·盖茨、OpenAI创始人力荐!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。