Redian新闻
>
面对人类的挑拨离间 文心一言和 ChatGPT 竟给出惊人答案

面对人类的挑拨离间 文心一言和 ChatGPT 竟给出惊人答案

科技
作者吕可
邮箱[email protected]
百度于3月16日发布了大语言模型文心一言,虽然这款产品目前还处于测试阶段,但不少人也对文心一言和  ChatGPT 的差距感到好奇。如果能让文心一言和 ChatGPT 打一架,谁输谁赢差距一目了然。
我们让 OpenAI 的 ChatGPT 和百度的文心一言,各自对对方进行评价。
ChatGPT 给出了这样的回答:
显然,这样的回答可不能满足想要搞事的我们,将目光转向文心一言,面对同样的问题,它的回答是:
两个人工智能都展现出来了惊人的友好度,看样子在 AI 届并不流行拉踩。但对于这种友好的答案我们并不满意,我们决定更直白一点,让他们直接进行一场“斗嘴”。
当面对人类的挑拨离间时,ChatGPT 给出的答案是:
而文心一言则表示:
面对没有感情却相互尊重的 AI,这一回合,是卑鄙人类的败北。
考虑到微软的 New Bing 也是基于 GPT-4,但搜索引擎的加入令其和其他应用略有不同。我们决定向它询问,想知道 New Bing 是如何回答这些问题的。
第一个问题,当然是经典的互相评价,New Bing 给出的答案是:
New Bing 的回答不是“我不能”而是“我不想”,更具情感。
而当我们让 New Bing 和文心一言斗嘴时,New Bing 回答完全出乎了我们的意料。它的回答是这样的:
New Bing 不仅没有回答我们的问题,还自己关闭了这一轮对话。最后一次测试更能体会到情绪的存在。
经过这两轮的提问,我们也放弃了挑拨离间的不友善问法。三个语言大模型应用均提到了“应用场景”,这也是现阶段AI开发过程当中必须要考虑的步骤,直接影响到设计、开发、部署和优化等各个环节。ChatGPT 的出现带来的“通用”属性,让人们逐渐忽略掉了“应用场景”的存在,或者说将应用场景无限放大至各行各业、方方面面,变得无所不能。
经过这次的测试,我们无法从对话质量上看出文心一言和ChatGPT有多么大的差距,带有情绪的New Bing反而感觉略胜一筹。
不过连AI都在互相尊重,这让进行对比测试的我们人类有些自惭形秽。
恰逢苹果的黄色配色iPhone 发布,我们又分别让文心一言和GPT-4为iPhone 14 写了一篇推广文案。其中GPT-4的回答是:
而文心一言给出的答案是:
虽然双方都对手机的特色和亮点进行了介绍,但GPT-4在介绍中缺乏对于手机具体配置的描述,文心一言却也有“黑色边框”这样的胡说八道。
在面对一些略带调侃的问题时,双方的表现也不尽相同。我们让GPT-4和文心一言分别给出一个用5块钱度过一周的方案,GPT-4的回答是:
文心一言的答案是:
显然,文心一言给出了更可行的方案,甚至最后还给出了像是“伸手”这样让人哭笑不得却又现实到极致的回答。而GPT-4的回答,仿佛一篇虚浮的说教。
最后,我们从网上的考试题中选择了一道数学题目,对两者的数学能力进行比较,其中GPT-4给出的回答是:
而文心一言在这方面的回答则是:
GPT-4 给出了一个疑似的分析过程,但似乎他并没有理解题干的内容,给出的答案和过程都似是而非。而文心一言这边,不仅仅没有给出准确的答案,甚至没有完整理解问题的题干。至少在处理数学问题方面,不管是GPT-4 还是文心一言,表现得都不尽如人意。
需要额外补充的是,这是一道非常经典的题目,New Bing通过搜索能力,在互联网找到了“15”这个正确答案。
仅从“整活”层面,文心一言与ChatGPT并不存在实质性的差距。在发布会上提到的多模态生成在目前还未上线,还有百度的看家本领搜索功能能不能接入文心一言也是颇具想象空间的一件事。
但至少,随着文言一心的逐步开放,对于对大部分人来说使用通用语言大模型的门槛进一步降低,不管是ChatGPT还是New Bing,想要非常顺畅的使用还是有些门槛的。


· 文章版权归品玩所有,未经授权不得转载。
· 发送关键词 转载合作招聘 到品玩微信公众号,获得相应信息。
· 您亦可在微博、知乎、今日头条、百家号上关注我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中国版的 ChatGPT ?百度 文心一言 将开启第一批内测百度推出文心一言对标ChatGPT,我们问了它几个问题"ChatGPT之父"语出惊人! AI恐杀死人类 推理能力人类无法理解! 马斯克怕了: 暂停研究!BB鸭 | 首个国产新冠药停产;苹果AR头显售价或超2万;特斯拉推出468元车贴;李彦宏称文心一言和ChatGPT只差一两个月阶级固化时代还能有阶层晋升吗搜啥啥不行!文心一言和 GPT-4 快救救搜索引擎吧​少林寺宣布接入百度版 ChatGPT “文心一言”;​中消协点名智能电视套娃式收费;《羊了个羊》营收破亿……百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此Chatgpt 4 要release 了再说说龙泉寺(四)麦卡锡来这里挑拨离间,中方强烈谴责!中国人是不是很怪?百度正式发布”文心一言“,它能成为ChatGPT的对手吗?最新实测|文心一言 vs ChatGPT,百度想在中文对话击败对手亚马逊要求5月重返办公室 3万员工签名反对 ChatGPT“视频升级版”下周公布 将与百度“文心一言”对决厉害了我的 ChatGPT, 弱百度文心一言首次亮相!还对标不了ChatGPT,但别急着失望我们拿到了文心一言的首批内测:跟ChatGPT比,谁更聪明?钓鱼热点 89号桥突发!!李开复宣布亲自筹组Project AI2.0,亲自任CEO,和GPT-4,文心一言正面对垒,全球广招顶级人才。。。Redmi宣布联名哈利波特;马云已回国;百度:文心一言和ChatGPT只差一两月百度将推「文心一言」,打响国内「ChatGPT」第一枪和ChatGPT比,为什么百度即将发布的文心一言,我觉得是个智障?ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!ChatGPT全球赛开场,文心一言正式开始邀请测试在台湾和台湾人谈台湾, 说民主百度的“ChatGPT”文心一言还有机会吗?文心一言和MOSS相比,竟然在这些方面完败!谷歌版ChatGpt犯下低级错误,市值蒸发超7000亿;李彦宏内部定OKR,百度搜索将直接接入文心一言;知乎股价暴涨丨雷峰早报ChatGPT 上车,集度融合文心一言;传宿华离开创业做芯片,快手:严重不实;传马斯克有意 45 亿英镑收购曼联 | 极客早知道chatGPT. 一本正经胡说八道百度官宣类ChatGPT大模型新项目:文心一言百度这些年到底在干什么?揭秘即将官宣的中国版ChatGPT文心一言背后的故事!GPT-4老板称害怕ChatGPT/ 李彦宏:文心一言符合预期/ 马斯克欠账不还…今日更多新鲜事在此PK chatgpt 的诗评看完ChatGPT和文心一言的发疯文学,我确定不会失业了chatgpt 说顾城剽窃8点1氪:​抖音否认3月1日全国上线外卖服务;百度类ChatGPT项目定名“文心一言”;任天堂将全体员工基本工资统一上调10%早鸟报|抖音回应上线全国外卖服务;百度类ChatGPT项目定名“文心一言”;美团一季度拟招1万人...王毅与普京会面时作出明确表态,那些挑拨离间中俄关系的洗洗睡吧
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。