Redian新闻
>
百度的“New Bing”终于来了,但我想说别高兴得太早。

百度的“New Bing”终于来了,但我想说别高兴得太早。

科技


昨天,百度搜索突然小范围内测了对话式 AI 。号称对标 New Bing ,还具有联网能力。


如果是真的,那百度这回,又是国内第一家整出有联网功能大模型的公司了。


巧了的是,差评君也刚好拿到了资格,又能带大家赶个热乎的了。


废话不多说啊,咱们就上手试试这个对标 New Bing 的百度新产品。


如果你是能抢先体验的用户,在百度搜索界面的引导栏里,你就能看到排在第一个的 AI 对话。


点进去之后,整体的聊天界面非常简洁。使用方法跟 New Bing 一样,都是对话形式。


至于跟自己的亲哥文心一言,到底有啥区别,它本人是这么说的。


不是一个东西,不是一个模型,甚至不是一家公司,。。。


但据报道,这个对话 AI ,明明是基于文心一言开发的。


但考虑到New Bing 也曾“ 发表 ”过自己是百度家产品的炸裂言论,毕竟对大语言模型来说,偶尔胡言乱语也算正常。


这玩意真能联网吗?所以为了验证它连上网线没,差评君赶紧着问了道测联网的问题:


百度发布智能手机。


这回,它给了我正确的回答,并且贴上了资料来源的 “ 百家号 ” 链接。


起码证明了,百度这个产品,确实是能够联网


既然这样,咱们干脆来个横评测试,看看百度和New Bing 两个联网大模型的能力到底谁比较厉害。


这不,今天上午,热腾腾的 NBA 比赛刚刚结束。那第一题,就问它们:NBA 最新比分。


结果让差评君有点吃惊, New Bing 和百度居然都犯了同样的错误。


两个参赛选手抓取的网页都是对的,都贴了 NBA 官网的链接。但是,尽管已经翻到了对的那一页,两个选手总结出来的比分都错了。


热火和尼克斯真正的比分是 103 : 112 ,湖人对勇士是 106 : 121 。


怎么对着答案抄,居然都能抄错的。。


第一局,双方都没得分。


那第二题,我们来点最近的互联网热梗——华语乐坛新四大天王。


虽然在我提示之后,百度抓取到了正确的文章链接,给出了一份对的人员名单。


但是,当差评君追问到代表作的时候,百度这小子又忘了,现在的华语乐坛,到底谁是真天王了。


至于 New Bing 这边,全程发挥稳定,一首“ 雪Distance ”惊艳全场。


这场华语乐坛角逐,到底还是微软技高一筹。

而第三题,我觉得还是犯璞归真,聊聊咱们普通人搜索概率更大的问题


结果,百度可以通过调用百度天气的数据,给你更精准的资料,甚至还有一个赏心悦目的图注。


而 New Bing 就有点傻傻分不清楚了,直接把 “ 接下来5天 ” 理解成了过去 5 天的天气情况。


1比1平,局面顿时焦灼了起来。


那决胜的最后一题,差评君想试一些联网功能,给日常生活带来的便利。


这里,我让它们给我规划一下路线从创景路到 in77 最快的路线。


本来,百度有自的百度地图,差评君觉得这一局,应该是百度稳赢。


结果出乎意料的是, New Bing 居然抄着百度的家伙,把百度 AI 给碾压了。


New Bing 直接调用了百度地图,很快就规划出了一条可用的路线。


虽然答案稍微有点小问题,因为 19 号线地铁刚刚开通到创景路。New Bing 提供的 5 号线,已经不是最快方案了。


但是,不管怎么说,比百度的回答好。。


它给出的几个路线全都不对,尤其是第一条步行的建议,更是相当炸裂。


创景路距离 in77 有 19 公里,一刻不停的走,也得走 4 个小时 34 分钟。。


但经过北京小伙伴的测试,它其实是能用调用百度地图的。


至于究竟是怎么一个调用逻辑,咱家不太清楚了。


这么几轮血战下来,在 New Bing 面前,百度还是略显逊色的。


总的来看,百度的搜索 AI 肯定是有联网能力的,这个是没有异议的。


但可能因为还是内测,使用起来很不稳定,比如抓取的资料内容质量不高、对链接文章内容总结不准确等等。


只不过让我比较纳闷儿的是,有些时候,这个对话 AI 可能还不如身为 “ 离线划水 ” 的文心一言,来的靠谱。


就拿我们首测文心一言的经典案例 “ 松鼠桂鱼的做法 ” 来说。


如果说文心一言平平淡淡的发言只能给 60 分的话。


那这个对话 AI ,就只能算 30 分。


答案不够详细就算了,甚至还在抄人家卷子的时候,把隔壁同学的名字都给抄过来了。


引用链接里,人家分享说自己 “ 厨房灯光暗,改刀看不清楚! ” ,百度把这种 “ 口水话 ” 都照搬上去。


这不是无脑打小抄的小学僧嘛。


当然了,这也不能全怪百度。


差评君觉得,主要还是目前互联网上,互相都不够开放的原因。比如百度就不容易抓到微信上的内容。


再加上,百度AI 引用的链接更倾向是百度百科等百度系的内容,自产直销。


这么一来,导致参考的资料可能不够多元,就容易出问题。


不过,针对这个问题,已经把 AI 玩出花来的编辑部同事,就给我安利了一个小妙招。可以通过英文互联网的资料译回中文,直接曲线救国。


还真别说,内容质量好像有肉眼可见的提高。


但是,引用不准确还可以理解,一些基本大模型能力,怎么也比文心一言逊色不少。


后面又试了几道弱智吧问题,基本招招致命。


怎么还质疑起游戏NPC 造假了


关于 “ 张三差点没上上上上海的车 ” 的问题,明明它差一点就理解对了。


结果,当我给它开个了后门——再给他一次机会的时候,他不仅直接选择 “ 摆烂 “ ,甚至还通过引用数据来吓唬我。


让你引用数据的时候,引用错了,顶嘴的时候,又引用得比谁都快。。


当然了,百度这次的新产品,也不是没有优化升级的。


除了联网之外,还跟 Bing 一样,支持对话文成图。甚至在页面左下角,开了一个叫 “ 灵感中心 ” 的东西。


里面全都是各种 AI 生成的小工具,比如解梦、抽象画,甚至还有赛博求签。。


粗看起来,是有点儿AI 应用商店那味儿了


而且,在使用过程中,差评君发现这个对话 AI ,好像一直致力于给你解决更具体的问题。


既然它这么渴望,我就给他们来一道加时赛——应用题。


说实话,光看这个标题倒是挺惊艳的。


结果,我想让百度顺便给我生成对应图片的时候,它就罢工了。


这牛脾气,真不知道是跟谁学的。


最后,我只能指名道姓地说出描述对象,让它给我画个欧洲早餐店图。


当然,出于合规的要求,还是会显示 AI 作图的水印,这该死的求生欲。


为了公平起见,我们也用 New Bing 重复了这个步骤,分别生成了一段文案和一张图。


生成图片


最后,咱们把两个图片和文案,同时丢到小红书上。看看到底谁的效果更好。


虽然百度的浏览量会越高一丝,但是 Bing 比百度多了两个点赞数。所以这道题就算是开放式题目了,具体哪个更好,相信每个茶友都有自己的答案。


最后总结一下,整体玩下来,还是能感觉到百度这产品和 New Bing 的客观差距。


但是考虑到,这只是初代版本,并且也还只是在小范围测试,以目前 AI 的更新速度来看,相信很快就会有体验上的提升。


北京航空航天大学的教授吴文峻说过一个观点,生成式 AI 的特点就是生成,所以不可避免会出现幻觉问题。


解决这个问题的唯一办法,就是需要更长的技术演进。要用看待人类学习进化的观点,去看待 AI 的发展。


至少在差评君看来,在微软一骑绝尘的 AI 时代,百度能做出来,并且敢推出这个产品,已经是相当不易了。


首先我们要有,这样才能谈演进,谈进化。


撰文:及格 & 四大   编辑:江江 & 面线   封面萱萱


图片、资料来源:

独家|百度文心一言发布,我们拿到内测账号试了试,效果出乎意料

对标必应聊天:百度搜索小范围公测“对话”功能,基于文心一言大语言模型



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
江西终于承认是鼠头了,最后我想说些主题遗憾和引申反思终于告别美元,卢拉高兴得合不拢嘴!上热搜的北大姑娘:我想说出,一些真相【交通安全】“duang”撞了,驾驶员说都是因为TA...Google正式官宣折叠屏Pixel Fold,大屏安卓的“指导意见书”终于来了Agustín Hernández:中美洲建筑背景下的未来主义巨构人类终于在围棋上赢了AI!业余棋手击败了顶级AI,但别高兴得太早娱乐圈又曝性骚扰,我想说出她的故事人人喊打的“老头乐”终于被封杀,但“大家乐”可能要来了。干旱没了?专家:别高兴太早!十几轮冬季风暴也无法让加州完全摆脱干旱,继续节约用水吧~里斯本粉红街(Pink Street),美妙创意你坐飞机脱鞋吗?空姐说别这样做 理由让人超恶心谁说别再买公寓了?大温公寓销量飙升175%!接近巅峰水平!佛州基韦斯特(Key West),街拍收获在外国用“please ding ding”点餐,你们不要命啦!《纽约客》(New Yorker)万字长文:起底郭文贵Npj Comput. Mater.: 高兴发团队很不高兴—与电子推推拉拉,成何体统?亚裔赢了!哈佛输了!中国学生爬藤更容易了?先别高兴太早……人人喊打的“老头乐”终于被封杀,但“大家乐”可能要来了读BBC新闻学英语:“nail-biting” 别翻译成“咬指甲”,该如何理解呢?马斯克突然给中国送“大礼”,特斯拉核心技术免费用?别高兴太早……来了!终于来了,IBM CEO说,公司凡是AI能做的,一律不再招人重磅出击!澳洲移民局再传好消息:免费签证、没有工作经验拿PR!这类签证持有者好政策都赶上了!网友:别高兴太早...袭击岸田嫌犯在自制铁管炸弹上加装螺母;日本游说别国“欢迎”排污入海的企图失败;美国百名青年洗劫便利店 | 每日大新闻巴西的事,别高兴太早首测丨之前的40系显卡不受待见,但上手了4070,我想说真香。经济衰退途上国谷歌的“GPT”终于憋出来了,但也就和百度打得有来有回。Kissin: Brahms - Piano Sonata No.3 in slow movement00后UBC学妹求助:男友同是留学生,但我想让他买房移民……安卓 14 终于来了,但功能都是从国产厂商那偷的。南澳散记 (增订本) :第二十八章:南澳学车记(下)如何形容马克龙访华?我想说,浪漫!快看!多伦多收藏家发现的超罕见“One Ring”游戏卡大多伦多男子玩刮刮乐中$100万大奖!高兴得和老婆抱一起连蹦带跳!今天才知道Friend里的Chandler Bing,暴打过加拿大总理小土豆很多次《玉骨遥》官宣开播,肖战,任敏主演。终于来了,啊啊啊!第一次用new bing “作弊”,发现AI的功能真好强大!可怕!狂赚66亿,这部年度大片终于来了,但是……对于“毕节殴打记者事件”的处理,媒体不要高兴得太早
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。