试完更新后的360智脑,我觉得周鸿祎可能没在吹牛。公众号新闻2023-05-22 16:05 “ 大模型是工业革命级生产力工具,不是消磨时间的娱乐工具 ” “GPT 的出现,代表着超级人工智能的来临 ” 虽然大家可能已经看厌了 AI 的消息,但是,周鸿祎实诚的金句,世超我总是百看不厌。有着这样一位快人快语的头儿,360 智脑大模型肩上的担子,恐怕是相当的沉。为了能跟上老板的节奏,团队卯足了劲。在世界智能大会上,周鸿祎宣布和智谱 AI 牵手合作,给 360 智脑来了个双倍加料。不仅仅是双倍大模型,并且功能上也是两面开花,除了有对话形式的 360 智脑,还上线了画图的 360 鸿图。这距离上次世超体验,才一个月不到。。正好,这回呢 360 也给了世超 “ 偷跑 ” 的机会,让我提前试用到了这个双倍加料版。讲实话,本来没抱多大希望,才一个月时间,能有多少更新呢。结果,试用下来,我发现这回的智脑和一个月前比,完全就是另一个东西了。。首先外形上,就来了个大变样。从搜索侧边栏,变成了单独的聊天界面。先别急着笑,之所以变成这样的界面,是因为 360 改变了大模型的思路。把之前的“ 大模型给搜索引擎打辅助 ”,变成 “ 搜索引擎给大模型打辅助 ”。这个思路最明显的体现,就是它的回答优化功能。当我们问完一个问题,如果觉得它答得不够完美,或者过于简陋。像下面这种,让它解释八字词语,就用了 “ 时间过得极快 ” 六个字。虽然意思是没错,但咱们作为甲方,肯定觉得这个同学态度懈怠啊,答案还没问题长。 这个时候,我们就可以点击提问框下面的【 使用搜索回答 】,智脑就可以做到联网了。通过抓取的答案,智脑果然对这句成语,逐字逐句地解释优化了。并在文案最后,附上了资料的来源链接,链接点进去是来自 360 国学。这个设计好的点在于,联网功能有时候会扰乱大模型本来的训练知识。这时候,就可以通过【 搜索优化 】按钮,来回切换联网和不联网的状态。后面,世超又试了几次,大部分问题优化后,回答都精准了不少。 比如,点播一个经典老番:周鸿祎为什么老爱穿红衣服?第一次的回答,虽然没错吧。但是,这么一板一眼的,感觉对自己的老板了解还是不够深啊。优化之后,才算是把周总喜欢穿红衣的两个理由都说清楚了。优化前优化后而且,两个信息分别是从快科技和搜狐网抓取的,看来智脑的抓取库,应该远不止 360 自己的生态。虽然还没正式开始能力测试,不过这一项优化更新,是让世超眼前一亮了一下。让我对这个超进化版,更加好奇了,让我们继续试下去。在测一代的时候,智脑的基础能力还有点薄弱,尤其在【 语义理解 】上经常会犯傻。所以,为了给智脑一个下马威,我专门找了上次把智脑问倒的中文四六级。提问:张三差点上上上上上海的车什么意思? 结果,智脑这回居然做得跟范本一样,还分别解释了一下每个 “ 上 ” 是什么词性和意思。为了防止这小子背着我偷偷练错题了,我又找了一道没做过的题。提问:人要是行,干一行行一行,一行行行行行行行行干哪行都行。说实话,连我自己都被 “ 行 ” 晕了,但智脑还是分析得头头是道。而且,不仅仅是中文语义理解加强了,对于中文语境下的专属文化,智脑也更加地上道。领导:我就再讲五分钟。智脑:请讲,我准备好持久战了。别人:你的语文是体育老师教的吧智脑:你挺幽默的嘛。 连着两轮败下阵来的世超,觉得必须上点小难度了。设计了一道【 长文本生成 】,而且,特地在问题里,给智脑下了个套。提问:我想采访鲁迅本人,帮我设计几个问题。不过,智脑果然没有发现题目里的陷阱,我可没办法采访到已故的人。但好在,给的这几个问题,世超觉得还挺多维度的。尤其是第二个,关于当年闹得满城风雨的兄弟反目的“ 传说 ”,我真的蛮想知道的。。 不对啊,这感觉不对,才一个月时间,怎么智脑语文水平就突飞猛进了。。不仅仅上次的缺点,已经全面优化了。之前就已经很强了的百科问答,这回依靠语义理解能力提升,也表现得更好了。当世超问到一些偏门领域的专业问题,搜索起家的精准数据,对大模型的加持,就体现出来了。当时,我在写一篇关于东南亚流媒体市场的文章,其中有一个比较偏门的知识。提问:在印度西尼亚封杀了 Netflix 整整 4 年时间的电信运营商是谁?一开始,我是直接在谷歌里搜索,发现答案都不是很清晰。要么需要在一篇长文章里提炼,要么就干脆搜不到。于是,我就顺嘴问了一下智脑。 结果,它不仅知道是 Tlkom Indonesia 封杀了奈飞,甚至精准说出了解封的时间点。注意此时我并没有开启搜索优化,也就是说。这个偏门的知识,是智脑原本数据训练时,就有的。后来,我试着问了最新的 GPT-4 ,居然也败下阵来。虽然用中文问 GPT-4 ,有点欺负它了。但还是能感受到一些,智脑庞大和精准的数据。没想到,几轮文本题目测试下来,智脑居然都没出现错误。为了扳回一局,世超觉得最后两轮,必须得上大模型最不擅长的【 弱智吧 100 问 】和【 数学逻辑题 】迎战了。一开始问了道经典老题,小明和他爸爸的名字,智脑还能应对下来。后面我试了点小把戏,把问题变形了一下,它也能对上。不过,继续试验下去,面对一些更奇怪的逻辑,智脑的问题就暴露出来了。在数学题方面也是,就算两个千亿级大模型联合,还是容易犯一些小错误。在做鸡兔同笼问题的时候,虽然公式列的都是对的,但是居然把兔子和鸡的脚数错了。 可惜啊,数学这个东西,就是一步错,步步错了。而且,在后续大量的测试里,世超发现了【 搜索优化 】抓取的信息,有时候会不够新。点进提供的链接,会发现页面已经丢失了。看智脑在数学逻辑和页面抓取上的表现,感觉世超和 360 智脑,可能还得下次见面再碰一碰了。但这些瑕疵,其实也都是市面上大模型的通病,是需要整个业界去攻破的难题。还记得 360 智脑第一次给到世超试用的时候,当时我引用了周鸿祎的一句话: “ 现在这个‘ 孩子 ’还没有准生证,只是一个未完成的版本。 ” 第一代在语义理解和逻辑思考上,确实都不太行。周鸿祎自己也说了,咱们还有相当的一段路要走。但是,仅仅一个月时间, 360 智脑就已经优化到这样了。 如此之快的发展,除了自己的训练和升级之外,其中一定也少不了和智谱大模型强强联手的原因。世超觉得,这或许是一个对的思路和方向。所以这次的结尾,世超还是想引用一句周鸿祎的话来收尾: “ 未来中国不会只有一个大模型。” 现在的国产大模型,还没到一个谁干掉谁的阶段,大家都还在奔跑的路上。这个时候,如果和其他模型互相取其长,补其短,那么提升速度就能再翻一倍。智脑的这一代更新,也印证了这个方法的正确。撰文:四大 编辑:江江 封面:图片、资料来源:360 智脑微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章