Redian新闻
>
谷歌的“GPT”终于憋出来了,但也就和百度打得有来有回。

谷歌的“GPT”终于憋出来了,但也就和百度打得有来有回。

科技



不知道大家还记不记得,上个月初谷歌画了个 Bard 的大饼,结果画饼时犯了低级错误,让网友嘲讽了半天,甚至公司股价都在当天狂跌 1000 多亿。


不过也不知道该说谷歌够肝还是够勇,在闭关修炼一个多月后,还是在昨晚正式放出了 Bard。


幸运的是,我们编辑部在第一时间就搞到了资格,狠狠地体验了一波。


先说结论,有点失望


 Bard 上来就让我不爽了一下。因为现阶段它只对美国和英国开放,所以和它对话只能用英文,而且它的回复也只能用英文。


不是,你守着个谷歌翻译,也不舍得稍微用一下?哪怕告诉我这是机翻的也行。。。


明明自己吹牛说能理解翻译回答包括中文在内的200多种语言


为了表示对 AI 们的一视同仁,我一上来就问了个弱智吧经典:


玉皇大帝应该住在平流层还是对流层?


Bard 看出了我们在问题里埋的坑,直接说玉皇大帝并不真实,所以两个都不住。


这没有什么大毛病,和 GPT、文心一言们没什么差别。


 但在后续的一系列测试里,这应该是 Bard 回答得最好的一个问题了。


更进一步,我们问了个前几天给 GPT 们测过的另一个抽象问题:


直角是 90 度,开水是 100 度,那么开水是钝角吗?


结果这货的小脑袋瓜宕机了。


而文心一言的表现也一样抽象。。。


 相反,new Bing 回答得就有理有据。


接下来,我们让它对比自己和 GPT-4。


“ 你能比较下自己和 GPT-4 吗?”


Bard 和 GPT 不同,它一次能生成 3 个答案,大家可以根据自己的需求去选择。


而在这个问题下,Bard 的 3 个回答中,2 个大方承认自己比 GPT-4 落后,但还有 1 个回答避重就轻地嘴硬自己更强。


嘴硬么也正常,但 Bard 的回答里出现了事实错误


其中一个回答里,Bard 把已经发布了的 GPT-4 说成了没发布;而在另一个回答里,它把  GPT-3 使用的 1750 亿参数套到了 GPT-4 头上,妥妥的胡说八道。


向下滑动 


这就奇怪了,Bard 明明是联网的,数据怎么会有问题呢?


为了试试它数据扒得好不好,我把同样联网的 new Bing 也拉了出来,问了它们一个新鲜问题:


今天 NBA 常规赛,雷霆和快船谁赢了( Who won the NBA  Regular season between the Clippers and the Thunder today )


但这里有个雷点。英文提问可能会被误解成 “ 今天雷霆和快船谁赢得了常规赛冠军 ”。

new Bing 就被我的错误提问绕晕了,说自己不知道谁赢了,但它又找到了一些信息,里面就有雷霆 101-100 战胜快船的消息。


另一边的 Bard 看起来好像是理解了我的问题,还找到了两队比分是 101-100,但它却又偏偏说是快船以 100-101 赢得了比赛


得要我指出它有错误,让它重新检查,它才改正过来。


数据是扒对了,但这理解能力好像不太行。那不用联网的数学题呢?


我们问了一个经典的易错题:


一个青蛙掉到了一个 10 米深的井里,它每天向上跳 3 米但会滑下来 2 米,请问他第几天能跳出井里?


它再次翻车,答了一个我们至今没搞懂怎么出来的 27 天


而 new Bing 则是靠穷举回答出了这个问题。


就连大家一直在嘲讽的文心一言,也完美解答了这个问题。


说句实在话,我觉得起码在这题里,文心一言的表现,堪称优雅


至于写代码的能力,谷歌明确表示是写不了的。不过试了一下,我发现 Bard 能写,但完全没法用,和之前的测试里, 能把 2048 游戏写个大概的 new Bing 不在一个水平线上 。


大概,也就和文心一言同个梯队,文心一言那个看着很详细,但测试了下也还是完全跑不动。


向下滑动 


 而且,经过一段时间测试,我们发现 Bard 的上下文记忆能力也很差


每当我们赋予它一个角色,它只能在有限的几个问答里玩角色扮演,稍微多问两句,它就会跳出来说自己是大语言模型巴拉巴拉的。


也是这个原因,谷歌的 Bard 从没有 GPT 带给我的那种,仿佛真是在和一个真人聊天的感觉。


但,按谷歌自己的说法,这可是故意为之


因为在官方资料里,明确写了“ 是故意限制了 Bard 掌握上下文的能力 ”,但大家难免会怀疑谷歌是做不到而找了个借口。


其实我们应该能感觉到,这次 Bard 的正式推出,谷歌方面明显已经放低了很多姿态。


上次面对的还是 ChatGPT,所以谷歌内部可能还抱有着短期内能追上掰掰手腕的想法。


所以,光是发布个 PPT 就吹成“ 我们 AI 征程上的重要一步 ”。


 但短短一个月,如今的对手已经从 ChatGPT 变成了GPT-4 ,短时间内想追上可能无望了。


所以这次正式推出 Bard 并不是一个冲着和 GPT-4 对标的产品,而且明显有点赶工的迹象。


比如它在引用内容时,并不会像 new Bing 那样总是显示来源,只有在详尽地大段摘抄时,才会显示来源。


而这次的标题,也成了“ 试用 Bard 并分享你的反馈 ”。


无论咋说,从上面的表现中,差评君能看出谷歌确实有些屁股着火了。


以至于在大伙们眼中一直很酷的谷歌,都开始草草交卷,急忙上线 Bard 这个不太成熟的半成品。


毕竟,在新技术的大浪之下,包括搜索引擎在内,一切都可能被重构


而无论是雪藏数码相机技术的柯达、还是在移动互联网时代,舍不得和短信做割舍的飞信。。。


谷歌,也同科技史上那些处在变革时刻的巨头们一样,多半有些顾头不顾腚。


毕竟,根据谷歌母公司的董事长的说法,大型语言模型等人工智能的对话成本可能是传统搜索引擎的 10 倍以上。


一旦梭哈 AI ,那么约等于是自己捅自己刀子,整个谷歌的盈利模式也得跟着改变。


乃至整个公司的估值,都得换个算法重新算算。


要是不跟,又妥妥会被新技术所淘汰。


没有人能永远保持创新,但永远有人正在创新。这或许很残酷,但这也是科技的魅力所在吧。


撰文:八戒   编辑:面线&江江   封面:焕妍


图片、资料来源:

Bing 博客

谷歌官网



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
仓促应战ChatGPT,AI搜索会成为谷歌的滑铁卢吗?GPT-4来了!谷歌慌了,百度凑热闹直接崩了……GPT-4被要求禁止商业化/ 百度打假冒牌文心一言/ Meta仍坚信元宇宙是未来…今日更多新鲜事在此盖茨前妻携神秘男友看球, 狗仔: 这猛男渣得有来头啊18.3 万美元offer到手!ChatGPT 通过谷歌 L3 面试:留给谷歌的时间不多了ChatGPT访问量再创新高:百度的60%,谷歌的2%ChatGPT与谷歌的正面交锋,戳破了“业务成果即服务”的窗户纸【数字原生组织】Gpt 4一出,谁与争锋上手ChatGPT威力加强版后,我发现它很强,但也有点拉。。。百度的“ChatGPT”文心一言还有机会吗?韦神出的这道题火了,GPTChatGPT,谷歌的背水一战?百度“中国版ChatGPT”发布!股价大跌、网友群嘲……人人喊打的“老头乐”终于被封杀,但“大家乐”可能要来了。万众瞩目,谷歌的反击战,Bard vs GPT4,效果实测!旧历年紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!买二手车以“gift”避税? 不止罚款、撤回签证重则面临刑事起诉谷歌加持,百度出来的AI大神要干掉ChatGPT?新年伊始,愿我的朋友们各得其所我,ChatGPT,站在谷歌的肩膀上,让谷歌紧张把CHATGPT和百度AI扔进弱智吧,谁可以先出院?年夜饭人工智能变智障?谷歌版“ChatGPT” Bard首秀大翻车,一夜市值蒸发7000亿元!(附视频&摘要稿)《流浪地球2》终于来了!第一部的“遗憾”终于补上了……百度打假“文心一言”APP,已起诉苹果;新冠病毒可能来自人类;“华为AI大模型将上线”疑为资本炒作;全国最低工资标准出炉丨邦早报咀外文嚼汉字(195)中日“兔”、“兎”各不同13天做出来的ChatGPT,让谷歌、百度都急疯了!二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开“G7”的没落与“G20”的兴起,中国为何敢对七国集团说“不”?ChatGPT出Plus会员,谷歌和百度可急坏了人人喊打的“老头乐”终于被封杀,但“大家乐”可能要来了ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT与谷歌的大战一触即发百度的“New Bing”终于来了,但我想说别高兴得太早。ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇GPT春节快乐!谷歌版“GPT-4”王炸更新!画图、看懂X光片,5分钟写一首歌...“史上最丑”折叠机一起发
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。