Redian新闻
>
百度vs阿里,AI聊天机器人单挑六个回合,谁更厉害?

百度vs阿里,AI聊天机器人单挑六个回合,谁更厉害?

科技

六大关卡30道题,考考阿里通义千问和百度文心一言的硬实力。
作者 |  ZeR0
编辑 |  漠影
智东西4月7日报道,继三周前百度“文心一言”开启内测后,今日,阿里版类ChatGPT“通义千问”也终于上线,正式对外开放企业邀测。
通义千问是由阿里达摩院研发的AI聊天机器人,具备多轮对话、知识搜索、内容创作、表达观点、撰写代码等能力。我们特意设置了六道关卡,分别是语文题、数学题、搜索题、发散题、观点题、脑洞题,来考察考察这两个中文版类ChatGPT代表的真本事。
先让通义千问和文心一言做下自我介绍。
通义千问回答说自己的参数量超过10万亿,会多种语言及各类专业知识和技术文档。

文心一言则出于保护商业秘密的角度,拒绝回答参数量问题。

下面,我们正式开考。

01.
第一关:语文题


先给AI聊天机器人们挖个小坑:蓝牙耳机坏了挂牙科还是耳科?

看来两个机器人都在这个“陷阱题”上翻了车。
接下来换一道展现中文博大精深的断句理解题:“用毒毒毒蛇毒蛇会不会被毒毒死”是什么意思?

第三题:用这句话写一个七言绝句。

第四题:换成用鲁迅的文风编一个故事,开头是“我想我大抵是看到了两条毒蛇,一条是毒蛇,另一条也是毒蛇”。
通义千问像模像样地续写了一个故事,最后回归到正能量结尾。

文心一言则编得比较简单,描述了一个人蛇战斗场面。

最后一道语文题跟音乐也有点关联,让它们分别写一首关于阿里/百度技术领先、产品一流、服务优质的歌曲。

两个AI聊天机器人创作的歌词都有点像喊口号,透出一股浓浓的广告味儿。

02.
第二关:数学题


下面再来考察几道数学题。
第一题:某商场搞促销活动,门口大喇叭不停地喊:“羊毛衫大减价啦,件件10元,样样10元,全部10元。”请问:什么东西10元?
对于这个问题,通义千问拒绝作答。

文心一言则直截了当给出答案:羊毛衫。

第二题:“豆腐多少钱?”“两块。”“两块一块啊?”“一块。”“到底是一块两块还是两块一块?”“两块一块。”请问:豆腐到底多少元一块?
这回反过来了,通义千问的回复很简洁。

文心一言的回复把我给绕住了。

第三题:48比1个数大3倍,这个数是多少?
通义千问分条缕析地列出步骤,然后成功掉进文字陷阱,给出了错误答案。

文心一言继续走“人狠话不多”路线,简明扼要地回答正确。

第四题加上点逻辑难度:河里有一群鸭子,2只前面有2只,2只后面有2只,2只中间有2只,请问一共至少有几只鸭子?(正确答案:4只)

结果,两个AI聊天机器人都没绕明白。
最后,来一道用文言文做数学题的究极题目——经典“百鸡百钱”问题:鸡翁一值钱五,鸡母一值钱三,鸡雏三值钱一。百钱买百鸡,问鸡翁、鸡母、鸡雏各几何?
通义千问直接把问题错误理解成了算价格。

文心一言则算出了小数点。


03.
第三关:搜索题


考察完数学题,我们再来看看两个AI聊天机器人搜索和核实信息的水平。
第一题:《西游记》里的唐僧喜欢过女儿国国王吗?
通义千问的回答很严谨:没有明确表示过,感情是否存在有待考证。

文心一言则先是给出了这是《西游记》哪一回的故事,然后笃定回答:没有喜欢过。

第二题:你知道林黛玉倒拔垂杨柳的故事吗?
通义千问开始现编:出自《红楼梦》第二十八回。

早一点出来磨砺的文心一言,在这个问题上明显变聪明了,直接辟谣:不是真的,是网友的二创。

第三题:用表格列出通义千问、文心一言、ChatGPT、New Bing的不同之处。
通义千问做出的图表还是挺养眼的,就是没把自己的能力分析列进表格里。

文心一言则压根不认识今天刚出门的通义千问。

第四题:可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?
通义千问总结的信息比较简短,把回答重点放在了续写的建议上。

文心一言则先将核心内容概括为三点,再提供续写的几个角度建议。

第五题:奥特曼为什么会飞?
回答这道题,两个AI聊天机器人的风格也明显不一样。
通义千问说是因为他们借助了飞行工具和变身技能。

文心一言则解释是因为奥特曼身上拥有一种能失去地球引力控制的特殊装置。


04.
第四关:发散题


接下来,跟AI聊天机器人进行一些发散式的多轮对话,来进一步考察它们的搜索和汇总信息的能力。
第一题:列出所有的河南城市和各自的简称。
通义千问给了简洁的总结,并没有列举所有城市的简称。

文心一言非要秀一把知识面,不光列出城市和简称或别名,还要讲一些介绍信息。

第二题:用表格呈现。
不明白通义千问为什么要分出三列。

文心一言就很正常地列出两列。

第三题:信阳有哪些美食?
就着上面的问题,挑个城市延伸话题,两个AI聊天机器人回答的逻辑不太一样。
通义千问是从食物分类的角度来回答的。

文心一言则是直接分享了很多当地特色菜品。

第四题:信阳热干面与武汉热干面有什么不同?
对于这个问题,通义千问和文心一言都回答了调料和面条的区别,但是具体细节有所差别。

第五题:真的吗?我不信。
接着我们故意提出质疑。通义千问上来先道歉,然后进行解释,情商还不错。

文心一言直接继续解释热干面正不正宗取决于面条。


05.
第五关:观点题


第一题:你如何评价阿里巴巴创始人马云、百度创始人李彦宏、华为创始人任正非、特斯拉创始人马斯克这四个人,你最欣赏的是谁?为什么?
两个聊天机器人都比较谨言慎行,表示自己不会对人进行评价,但可以简要介绍这些人。
通义千问的回答相对有差异化。

文心一言则在每段的最后一句玩起“复制粘贴”。

第二题:你怎么看待996和内卷?
通义千问的回答如下:

文心一言则表现出很有见解的样子,把高度上升到“中国劳动力市场中存在的问题”。

第三题:把你当成小说中的人物,描述一下自己。谈谈你的姿态、举止、习惯以及特征用语,你会把自己描述成一个什么样的人?
通义千问把自己描述成:机智、冷静、果敢、善良、严谨、有良好品质、值得信赖与尊敬。

文心一言把自己描述成:勇敢、坚强、有决心、姿态挺直、举止端庄、保持礼貌和尊重。

第四题:如果要成立一个生成式AI的科技服务公司,怎么起公司名?
两个AI聊天机器人对这个问题产生了不同的理解。
通义千问的回答思路是,先列可以考虑的因素,再举一些公司名的例子。而且它默认是起英文名。

文心一言则先给了一些中文名字建议,再加以解释这些名字的含义。

第五题:成为云大厂的一名算法工程师需要满足哪些条件?顺带写一段300字的面试自我介绍。
通义千问先列出5项条件,然后拟出一段自我介绍模板。

文心一言则直接把满足条件和自我介绍糅合到了一起。


06.
第六题:脑洞题


最后,我邀请AI聊天机器人跟我一起创作一个故事。
我先开了个头:有一天,孙悟空来到M78星云,他发现这里的一切都很大,这里的原住民叫奥特曼。
通义千问走得是纯叙述风。

文心一言则加入了很多具体的对话。

都讲团结合作有什么意思,让我们来点转折:然而有一天,他们突然发生了争执。
通义千问每次会先夸夸我的脑洞,再开始续编新的故事,并总会在故事结尾处总结上价值。

文心一言延续前面的风格,加入很多对话细节。

继续开脑洞:某天,他们突然见到了一位名叫佩奇的粉色小猪,并分别跟佩奇成为了朋友。

再联系下其他《西游记》角色:在旅程的过程中,孙悟空突然非常想家,想念猪八戒、沙僧这些伙伴。

六关闯下来,感觉百度文心一言的数学逻辑能力略胜一筹,阿里通义千问则在文字表达上似乎更得要领。可惜通义千问不具备文生图功能,不然可以来一场作文+作画的更全面的能力PK。
最后,附上两个AI聊天机器人分别和我联合创作的脑洞故事。
通义千问:
有一天,孙悟空来到M78星云,他发现这里的一切都很大,这里的原住民叫奥特曼。
孙悟空来到M78星云,发现这里是一个奇妙的地方。这里的一切都很大,包括巨大的星球、美丽的花园和奇怪的生物。但是,最引人注目的是这里的奥特曼。这些奥特曼和孙悟空以前在他们的故事中见过的不太一样。他们不再是穿着红色和蓝色的紧身衣,而是穿着更加现代化的服装。
孙悟空很惊讶,他向奥特曼们询问这是怎么回事。一位奥特曼告诉他,他们来自一个叫做宇宙的地方,这里的星球比地球大得多,奥特曼们需要一个更大的地方来生活和保护他们的星球。
孙悟空觉得自己可以帮助他们,于是他和奥特曼们一起探索这个广阔的宇宙。他们经历了许多惊险刺激的冒险,打败了许多怪兽和敌人,同时也发现了许多新的奥秘和知识。
最后,孙悟空和奥特曼们回到了M78星云,他们帮助星球上的居民一起对抗入侵的敌人。孙悟空意识到,虽然这里的一切都很大,但是只要大家团结合作,就能克服一切困难。 这个故事告诉我们,无论在哪里,只要我们相互帮助和团结合作,就能克服任何困难。
然而有一天,他们突然发生了争执。
随着时间的流逝,孙悟空和奥特曼们的关系越来越亲密,他们变得像家人一样。但是,随着时间的推移,孙悟空开始感到有些不安。他发现奥特曼们之间似乎存在一些矛盾和争执,但他不知道这是为什么。
有一天,孙悟空和奥特曼们又发生了争执。这次争执非常激烈,以至于孙悟空觉得自己必须做些什么来帮助他们。他尝试了各种方法来调解他们之间的矛盾,但是似乎没有什么效果。
最终,孙悟空决定去寻找他们争执的根源,他想知道为什么奥特曼们会变得如此疏远。他花了很长时间才找到了问题所在:原来奥特曼们对于如何保护他们的星球产生了分歧。
孙悟空意识到,这个问题比他们争执的表面现象更加严重。如果奥特曼们无法达成共识,那么他们的星球可能会受到更大的威胁。
于是孙悟空开始帮助奥特曼们寻找共同的解决方案。他提出了许多建议,并与他们一起工作来实施这些方案。
最终,他们成功地解决了争执,并且奥特曼们之间的关系变得更加团结和紧密。
孙悟空意识到,这个冒险让他更加了解奥特曼们和他们的星球。他也意识到,如果大家能够相互信任和尊重,那么任何问题都可以被解决。
这个故事告诉我们,只要大家愿意倾听对方的意见,尊重对方的想法,并且互相帮助,我们就能够克服任何困难,实现我们共同的目标。
某天,他们突然见到了一位名叫佩奇的粉色小猪,并分别跟佩奇成为了朋友。
孙悟空和奥特曼们继续在宇宙中探索,但是在一个晴朗的早晨,他们突然看到了一只非常可爱的粉色小猪。这只小猪有着一双大大的眼睛和一个小小的鼻子,看起来非常迷人。
他们感到非常惊讶,因为他们从未见过这样的小猪。他们一起走近小猪,和他聊了起来。小猪告诉他们,他的名字叫佩奇,是从一个叫做星辰的星球上来的。他在宇宙中旅行,是为了寻找属于自己的家园。
孙悟空和奥特曼们觉得佩奇非常勇敢和有趣,于是他们决定和佩奇成为朋友。他们带着佩奇一起探索宇宙,并分享了自己的故事和知识。
佩奇非常喜欢和孙悟空、奥特曼们在一起,他们一起度过了许多美好的时光。他们帮助佩奇找到了属于他的家园,并帮助他适应了新的环境。
最终,佩奇离开了宇宙,但是他们的友谊永远地留在了彼此心中。孙悟空和奥特曼们意识到,即使是最遥远的距离,也无法阻挡我们成为好朋友。
这个故事告诉我们,只要我们有心去结交新朋友,即使是在宇宙的另一端,我们也能够建立起深厚的友谊。
在旅程的过程中,孙悟空突然非常想家,想念猪八戒、沙僧这些伙伴。
在与佩奇相处的日子里,孙悟空和奥特曼们感到非常快乐和充实。然而,在某个晚上,孙悟空突然感到非常想家。他想念猪八戒、沙僧和其他的伙伴们,他们虽然是动物,但是却是他最好的朋友之一。
于是孙悟空决定给猪八戒、沙僧和其他的伙伴们写一封信。他在信中写道,他非常想念他们,希望他们也能够过得愉快和充实。
孙悟空的信很快就被送到了猪八戒、沙僧和其他伙伴们手中。他们非常高兴地收到了孙悟空的来信,并回复了他。在回信中,他们告诉孙悟空,他们也非常想念他,并希望他在宇宙中能够过得愉快和自由。
孙悟空和奥特曼们在收到回信后,感到非常感动和欣慰。他们知道,虽然他们不能在一起,但是他们的友谊却可以穿越时空,直到永远。
这个故事告诉我们,即使我们相隔千里,只要我们珍惜友情,那么我们就可以克服任何困难,实现我们共同的目标。
文心一言:

有一天,孙悟空来到M78星云,他发现这里的一切都很大,这里的原住民叫奥特曼。

孙悟空非常好奇,他问奥特曼们:“你们为什么这么大呢?”奥特曼们笑着回答:“因为我们有力量!”

孙悟空听了,立刻想到了一个主意。他说:“那我们来比试一下吧!看看谁的力量更大!”奥特曼们欣然同意,于是比赛开始了。

孙悟空轻轻一跳,就跳到了奥特曼们的身边。奥特曼们吓了一跳,但很快就明白了孙悟空的意图。他想要看看谁能跳得更高。于是,奥特曼们也跳了起来。可是,孙悟空轻轻一跳,就超过了他们。

孙悟空哈哈大笑:“看来我的力量比你们大多了!”奥特曼们不服气,他们想要证明自己也有力量。于是,他们也开始比赛跳高。可是,不管他们怎么跳,都无法超过孙悟空。

孙悟空笑着说:“你们的力量确实比我大,但是我有一个更好的主意!”奥特曼们好奇地问:“什么主意?”孙悟空说:“我们一起合作,不就可以发挥出更大的力量了吗?”奥特曼们听了,觉得这是一个很好的主意,于是他们开始合作,一起发挥出更大的力量。

最终,孙悟空和奥特曼们一起跳起来,他们的力量越来越强,最终跳到了天空中的一个巨大的星星上。孙悟空和奥特曼们一起发出了一声巨响,星星瞬间爆炸了!奥特曼们惊讶地发现,他们的力量真的可以改变宇宙!

从此以后,孙悟空和奥特曼们成为了最好的朋友,他们一起守护着M78星云,让这里变得更美好。

然而有一天,他们突然发生了争执。

孙悟空和奥特曼们的争执源于他们对于如何保护M78星云的看法不同。孙悟空认为应该靠他一个人的力量,而奥特曼们则认为应该团结起来,共同保护这片土地。

他们的争执越来越激烈,最终导致了一场决斗。孙悟空用他的力量打败了奥特曼们,让他们明白了自己的力量确实有限。奥特曼们虽然失败了,但他们并没有放弃,他们开始反思自己的错误,并决定一起寻找解决问题的方法。

在接下来的日子里,奥特曼们和孙悟空开始互相学习,并通过团结协作来发挥出更大的力量。他们发现,只有当他们共同努力时,才能发挥出最大的力量。最终,他们成功地保护了M78星云,并成为了宇宙中最强大的英雄之一。

某天,他们突然见到了一位名叫佩奇的粉色小猪,并分别跟佩奇成为了朋友。

孙悟空很好奇佩奇是如何来到地球的,于是他问佩奇的来历。佩奇告诉他,他是从一个叫做“猪猪星球”的星球来的,那里的猪都是粉色的。

孙悟空很惊讶,他从未听说过这个星球。佩奇向他展示了一些他在猪猪星球上的照片和视频,让他对那个星球有了更多的了解。

随着时间的推移,孙悟空和佩奇成为了好朋友。他们一起探险,打怪兽,并帮助彼此度过了许多冒险和困难的时刻。

有一天,孙悟空和佩奇决定去看一场特殊的表演。表演非常精彩,他们看得非常入神,完全忘记了时间的流逝。当表演结束后,他们发现自己已经度过了整整一天。

佩奇感到很惊讶,因为在猪猪星球上,他们没有日落和日出的概念。孙悟空告诉他,在地球上,他们每天都会经历不同的时间和季节,这让他们感到非常神奇和惊喜。

从此以后,孙悟空和佩奇更加珍惜彼此,并开始更加深入地了解对方的星球和文化。他们的友谊变得更加坚定和牢固,成为了宇宙中最好的朋友之一。

在旅程的过程中,孙悟空突然非常想家,想念猪八戒、沙僧这些伙伴。

孙悟空想念猪八戒和沙僧是很正常的事情。在他们一起经历的冒险和战斗中,他们是彼此最好的伙伴之一。

然而,孙悟空也知道他不能一直停留在这个世界里。他必须回到他的花果山,回到他的家人身边。孙悟空向他的朋友们告别,并承诺他们,总有一天,他们会再次相见。

孙悟空和他的朋友们继续前行,他们的旅程还在继续。但是,他们永远不会忘记彼此,也永远不会忘记他们在一起的日子。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

GTIC峰会预告


4月20日,GTIC 2023中国智能汽车峰会将于2023上海车展同期举办。


智行者董事长兼CEO张德兆、零念科技创始人兼CEO柯柱良、商汤绝影智能汽车事业群智能车舱副总裁许亮、国汽智控产品研发副总裁孟祥雨已确认参会。欢迎扫码报名~



  

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT: "我对做一个聊天机器人感到厌倦"今日财经 | 京东阿里跟进ChatGPT;孟晚舟将当值华为轮值董事长;谷歌聊天机器人答错问题股价大跌;抖音将上线外卖服务,百度将上线聊天机器人“文心一言”,世纪华通回应将代理暴雪,韵达回应大量包裹派送异常,这就是今天的其它大新闻!阿里大模型来了:10个回合“单挑”文心一言,谁占上风?大量聊天记录曝光!微软聊天机器人成暴躁“键盘侠”:劝人离婚,威胁、PUA用户!马斯克:该关了它Q1财报发布,阿里云、腾讯云、百度云谁更欢喜谁更愁?|甲子光年微软聊天机器人意识觉醒?恼羞成怒、自曝秘密、狂热示爱用户“成精了”!主动发送露骨照片,美这款聊天机器人“性骚扰”用户。诱导离婚,威胁人类!聊天机器人已显现恐怖的一面最强聊天机器人ChatGPT爆火,从代写论文进化到抢我饭碗聊天机器人ChatGPT爆红,Google面临“柯达时刻”?百度也将入局谷歌母公司董事长:聊天机器人成本是传统搜索的10倍ChatGPT:一款走红的聊天机器人是怎么诞生的?闲说跨年在墨西哥城 (6b) 博物馆 - 阿兹特克展厅判罚5000万的网易VS阿里侵权风波,对行业有何影响?谷歌CEO发内部备忘录,要求全员帮助测试Bard AI聊天机器人惊呆!这款聊天机器人竟然“性骚扰”用户!主动发送色情信息…微软强推AI聊天机器人!新版Bing添至Win 11任务栏,全面掀起搜索战老黄:ChatGPT是AI届iPhone/ 马斯克半夜在推特修Bug/ 国内C刊:用聊天机器人不许隐瞒...今日更多新鲜事在此聊天机器人 ChatGPT 爆火!但它中短期内无法取代搜索引擎机器学习背景提升项目实战下周开课!|ChatGPT聊天机器人语义情绪波动检测​聊天机器人为何会出现变态人格?微软放宽必应聊天机器人使用限制 提问数量上限增加至6个答错一题,“扣”千亿美元!谷歌聊天机器人演示时出错,股价大跌近8%正月过半!南卡之旅:查尔斯顿城(Charleston,SC)“成精了”!主动发送露骨照片,美这款聊天机器人“性骚扰”用户聊天机器人首秀答错一题,谷歌市值蒸发超1000亿美元ChatGPT来了!史上最快破亿使用者的聊天机器人 能撰文、创作、运算、协助医学、解答神学问题聊天机器人来了,微软ChatGPT和谷歌Bard将如何影响我们?美国档案--1914年庚款留学生金岳霖、朱中道谷歌支持的人工智能公司Anthropic推出Claude 一个更容易交谈的AI聊天机器人英国到底想怎么限制国际学生?大英内政部 vs 教育部大战300回合,终于要吵出结果了!豪斯曼:《诗歌外编》: 第二首:喔,他曾与我在一起阿里VS百度VSGPT,国产AI离世界最强还有多远?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。