必应版ChatGPT内测资格海量发放！知乎大佬：别作死，就很强

公众号新闻

2023-02-19 04:02

新智元报道

编辑：编辑部

【新智元导读】ChatGPT版必应对一些网友已经开放测试了，综合大家的反馈，总的来说就是——它很强。

小编还在waiting list上望眼欲穿地苦等，但是幸运的人已经有必应的内测资格了！

话不多说，下面上一波国内外网友的测评。

知友测评

知友「ccskai」表示，相对于ChatGPT，新必应响应速度真的太快了，汉字刷刷地出，几乎不卡壳。

其次在引用上，相对于ChatGPT，必应的AI会去搜索网页，然后总结网页的内容给出答案。这样，在信息的时效性上，必应就比ChatGPT领先了不少。

要求他将文章改成某种风格，它会先去搜某种风格怎么改，然后他自己再改。

能看懂「月色真美，适合刺猹」，这个必应厉害了。

图源：ccskai

不同于ChatGPT的没主见，必应AI在坚持观点方面做得很好。

图源：ccxkai

当被「ccskai」突然表白时，必应受宠若惊，使用了大量的流汗黄豆（大概是中文数据集的特色吧😅）。可以脑补一下日本动漫中那种羞涩挠头说着「いやあ～いやあ～」的男生。

OMG，这也太会卖萌了吧……

知友「hez2010」发现，必应配合Edge的网页上下文理解能力太强了。

图源：hez2010

它不仅推测出了正确的label，还知道如何使用GitHub搜索来筛选，让网友大呼震撼。

图源：hez2010

「知友钛科闹了技Tech」表示，新必应相比于之前ChatGPT有两个很恐怖的提升：

1.接入网络了，可以获取实时信息

2.可以通过我的提示和网络上的消息来自我验证，还能看到纠错后的正确结果

所以再用一段时间，训练多了，反馈多了，准确率会越来越高。

「钛科闹了技Tech」问了必应「Time获得了中国星际有史以来第一个冠军」这个消息，必应并不知道。

图源：钛科闹了技Tech

可以看出，必应虽然联网了，但对最新消息的收录仍有一定的门槛。但是，它可以纠错了。

下图可以看出，必应的纠错能力很强大。

图源：钛科闹了技Tech

「知友钛科闹了技Tech」问了必应一个他自己都存疑的内容。

图源：钛科闹了技Tech

结果必然居然正面回答了，「知友钛科闹了技Tech」当场表示：「它带给我的震撼已经无可言表……」

图源：钛科闹了技Tech

知友「永遇乐」也说，「体验有点恐怖。本来以为只是简单的给bing加个chatgpt访问借口，没想到是直接汇总你问题的查询结果，以人话给你说明并标记参考资料。这比普通搜索或不知道信息来源的原生ChatGPT强多了。」

随便问个问题，都可以直接查看答案信息来源（图源：永遇乐）

答主「幽幽夜」表示，新必应比起ChatGPT更快、更稳定。

写的代码段质量很高，还可以自动解析代码内容。

图源：幽幽夜

以后用ChatGPT和不用ChatGPT的程序员，或许效率会有天壤之别了。

图源：幽幽夜

新必应vs.ChatGPT

下面，咱们来看看一位外国网友的测评。他把新必应和ChatGPT、老必应、谷歌、Bard都做了一番全方位的比较。

众所周知，ChatGPT的训练数据只有2021年之前的。

而新必应不仅可以访问网页和最新的数据，同时还能在结果中给出参考资料的来源。

举个例子，你要是问ChatGPT推特的现任CEO是谁，它肯定答不上来。但新必应就可以脱口而出。

此外，新必应还将搜索提示一并加到了聊天框和精选摘要里。

不管用户点击哪一个，都可以体验到更具沉浸感的聊天体验。

新必应vs.老必应

新必应与老必应的核心搜索结果实际上是相同的，唯一的区别是聊天机器人的存在。

过去的十几年，必应的目标是让核心搜索结果达到谷歌的标准。但在这之前，必应需要改进的地方还有很多。

尤其在广告方面，微软这些为了年确保收益采用了太多的「黑科技」。

具体而言，老必应存在有3个核心问题：

广告数量过多：必应会在搜索结果中展示5个广告，而谷歌最多是4个。
广告差异极小：必应故意将搜索结果之间的差异做得很小，用户难以区分词条之间的差别，很可能会意外点中广告。
EMD权重过大：不可否认，搜索结果中必应给予精确匹配占比很大，可以说已经到了泛滥的地步。

而新必应在AI的加持下，看起来确实更具吸引力。

当然，目前这个功能还存在一些bug。

比如下面就是没有被触发时候的样子——AI就是把其中一个结果「框起来」了而已。

新必应vs.谷歌

以必应现在的市场份额，即便是搜索结果有了AI的加持，也远不足以推翻谷歌的地位。

然而，万万没想到到的是，谷歌在首次发布Bard时，就打了自己的脸。

注意看，Bard的其中一个回复是「JWST拍摄了我们太阳系以外的行星的第一批照片」，然而这并不准确。

实际上，有史以来第一张关于太阳系以外的行星，也就是系外行星的照片，是在2004年由智利的甚大射电望远镜（Very Large Array, VLA）拍摄的。

这颗系外行星被称为2M1207b，大小约为木星的五倍，位于离地球约170光年处。

是的，正如新必应给出的结果所说的那样。

显然，在目前的形式下，新必应的确有能力从谷歌手里夺走一些潜在的流量。

新必应vs.Bard

谷歌发布的Bard，其重点是在于有NORA（没有一个正确答案）的查询，这似乎与新必应使用的方法不同。

在发布会上，谷歌重点强调了Bard在处理NORA（没有一个正确答案）问题时的能力。

在谷歌给出的示例中，Bard提到最好的星座是猎户座、仙后座、大熊座和飞马座。

而新必应则详细介绍了一组不同的建议，包括金牛座、剑鱼座，以及其他几个谷歌没有提到的星座。

至于哪个答案「更好」，基本上全凭大家都主观判断，不过从传统搜索的使用体验上来看，谷歌通常会更胜一筹。

总结一下：

新必应有近乎实时（有延迟）的网络访问，可以找到ChatGPT没见过的数据。
新必应并没有取代精选摘要等SERP功能，而是将聊天功能作为一个扩展。在部分情况下，新必应会提供「双倍」的答案，让页面显得非常混乱。
老必应还有很长的路要走，毕竟有很多阻碍着它与谷歌竞争的问题，至今都还没得到解决。
在Bard给出的建议里，谷歌并没有给出作为参考的信息来源，而新必应则有大量的链接可供用户点击。

目前来说，虽然在搜索引擎中加入由AI驱动的聊天结果这件事还处于初期阶段，但进展迅速。

而这些变化对传统搜索所产生的影响，也不一定是负面的。

毕竟，每隔几年都会有人提出这样那样的担忧，但搜索行业却仍在快速地增长。

参考资料：

https://www.zhihu.com/question/583588366

https://dkb.blog/p/bing-ai-cant-be-trusted

https://brodieclark.com/new-bing-review/

特别鸣谢：

「ccxkai」https://www.zhihu.com/question/583588366/answer/2889780355

「钛科闹了技Tech」https://www.zhihu.com/question/583588366/answer/2891347604

「hez2010」https://www.zhihu.com/question/583588366/answer/2892199436

「永遇乐」

https://www.zhihu.com/question/583588366/answer/2892200163

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章