【新智元导读】ChatGPT版必应对一些网友已经开放测试了,综合大家的反馈,总的来说就是——它很强。
小编还在waiting list上望眼欲穿地苦等,但是幸运的人已经有必应的内测资格了!
知友「ccskai」表示,相对于ChatGPT,新必应响应速度真的太快了,汉字刷刷地出,几乎不卡壳。其次在引用上,相对于ChatGPT,必应的AI会去搜索网页,然后总结网页的内容给出答案。这样,在信息的时效性上,必应就比ChatGPT领先了不少。要求他将文章改成某种风格,它会先去搜某种风格怎么改,然后他自己再改。图源:ccskai
不同于ChatGPT的没主见,必应AI在坚持观点方面做得很好。图源:ccxkai
当被「ccskai」突然表白时,必应受宠若惊,使用了大量的流汗黄豆(大概是中文数据集的特色吧😅)。可以脑补一下日本动漫中那种羞涩挠头说着「いやあ~いやあ~」的男生。知友「hez2010」发现,必应配合Edge的网页上下文理解能力太强了。图源:hez2010
它不仅推测出了正确的label,还知道如何使用GitHub搜索来筛选,让网友大呼震撼。「知友钛科闹了技Tech」表示,新必应相比于之前ChatGPT有两个很恐怖的提升:1.接入网络了,可以获取实时信息
2.可以通过我的提示和网络上的消息来自我验证,还能看到纠错后的正确结果
所以再用一段时间,训练多了,反馈多了,准确率会越来越高。「钛科闹了技Tech」问了必应「Time获得了中国星际有史以来第一个冠军」这个消息,必应并不知道。图源:钛科闹了技Tech
可以看出,必应虽然联网了,但对最新消息的收录仍有一定的门槛。但是,它可以纠错了。图源:钛科闹了技Tech
「知友钛科闹了技Tech」问了必应一个他自己都存疑的内容。图源:钛科闹了技Tech
结果必然居然正面回答了,「知友钛科闹了技Tech」当场表示:「它带给我的震撼已经无可言表……」图源:钛科闹了技Tech
知友「永遇乐」也说,「体验有点恐怖。本来以为只是简单的给bing加个chatgpt访问借口,没想到是直接汇总你问题的查询结果,以人话给你说明并标记参考资料。这比普通搜索或不知道信息来源的原生ChatGPT强多了。」
随便问个问题,都可以直接查看答案信息来源(图源:永遇乐)
答主「幽幽夜」表示,新必应比起ChatGPT更快、更稳定。图源:幽幽夜
以后用ChatGPT和不用ChatGPT的程序员,或许效率会有天壤之别了。图源:幽幽夜
下面,咱们来看看一位外国网友的测评。他把新必应和ChatGPT、老必应、谷歌、Bard都做了一番全方位的比较。
众所周知,ChatGPT的训练数据只有2021年之前的。而新必应不仅可以访问网页和最新的数据,同时还能在结果中给出参考资料的来源。举个例子,你要是问ChatGPT推特的现任CEO是谁,它肯定答不上来。但新必应就可以脱口而出。此外,新必应还将搜索提示一并加到了聊天框和精选摘要里。不管用户点击哪一个,都可以体验到更具沉浸感的聊天体验。新必应与老必应的核心搜索结果实际上是相同的,唯一的区别是聊天机器人的存在。
过去的十几年,必应的目标是让核心搜索结果达到谷歌的标准。但在这之前,必应需要改进的地方还有很多。尤其在广告方面,微软这些为了年确保收益采用了太多的「黑科技」。- 广告数量过多:必应会在搜索结果中展示5个广告,而谷歌最多是4个。
- 广告差异极小:必应故意将搜索结果之间的差异做得很小,用户难以区分词条之间的差别,很可能会意外点中广告。
- EMD权重过大:不可否认,搜索结果中必应给予精确匹配占比很大,可以说已经到了泛滥的地步。
比如下面就是没有被触发时候的样子——AI就是把其中一个结果「框起来」了而已。以必应现在的市场份额,即便是搜索结果有了AI的加持,也远不足以推翻谷歌的地位。
然而,万万没想到到的是,谷歌在首次发布Bard时,就打了自己的脸。注意看,Bard的其中一个回复是「JWST拍摄了我们太阳系以外的行星的第一批照片」,然而这并不准确。实际上,有史以来第一张关于太阳系以外的行星,也就是系外行星的照片,是在2004年由智利的甚大射电望远镜(Very Large Array, VLA)拍摄的。这颗系外行星被称为2M1207b,大小约为木星的五倍,位于离地球约170光年处。显然,在目前的形式下,新必应的确有能力从谷歌手里夺走一些潜在的流量。谷歌发布的Bard,其重点是在于有NORA(没有一个正确答案)的查询,这似乎与新必应使用的方法不同。在发布会上,谷歌重点强调了Bard在处理NORA(没有一个正确答案)问题时的能力。在谷歌给出的示例中,Bard提到最好的星座是猎户座、仙后座、大熊座和飞马座。而新必应则详细介绍了一组不同的建议,包括金牛座、剑鱼座,以及其他几个谷歌没有提到的星座。至于哪个答案「更好」,基本上全凭大家都主观判断,不过从传统搜索的使用体验上来看,谷歌通常会更胜一筹。总结一下:
新必应有近乎实时(有延迟)的网络访问,可以找到ChatGPT没见过的数据。
新必应并没有取代精选摘要等SERP功能,而是将聊天功能作为一个扩展。在部分情况下,新必应会提供「双倍」的答案,让页面显得非常混乱。
老必应还有很长的路要走,毕竟有很多阻碍着它与谷歌竞争的问题,至今都还没得到解决。
在Bard给出的建议里,谷歌并没有给出作为参考的信息来源,而新必应则有大量的链接可供用户点击。
目前来说,虽然在搜索引擎中加入由AI驱动的聊天结果这件事还处于初期阶段,但进展迅速。
而这些变化对传统搜索所产生的影响,也不一定是负面的。毕竟,每隔几年都会有人提出这样那样的担忧,但搜索行业却仍在快速地增长。https://www.zhihu.com/question/583588366https://dkb.blog/p/bing-ai-cant-be-trustedhttps://brodieclark.com/new-bing-review/「ccxkai」https://www.zhihu.com/question/583588366/answer/2889780355「钛科闹了技Tech」https://www.zhihu.com/question/583588366/answer/2891347604「hez2010」https://www.zhihu.com/question/583588366/answer/2892199436https://www.zhihu.com/question/583588366/answer/2892200163