Redian新闻
>
问360智脑五个刁钻问题,下面是它的回复

问360智脑五个刁钻问题,下面是它的回复

科技

发布一个月之后,360智脑再度升级。

一眼望去最显著的变化来自UI界面,升级后的360智脑拥有一个类似chatGPT聊天机器人的外观,而不像上一代是个搜索侧边栏。这种UI界面的变化其实强化了360智脑“产品”的属性——它不再是一个依附搜索的额外功能,而是一个完整的独立产品。

实际上这次360智脑时隔一个月的升级,最大的提升就是搜索能力。在变成一个独立的产品后,360智脑在聊天过程中给出的答案已经能够整合互联网内容,它甚至在界面上设计了一个按钮,让用户可以选择“使用搜索回答”。

由此,这个大模型产品日趋完整。它既能够调用大模型能力,也能够结合互联网内容,360甚至在所有回答下方都添加了一个点赞按钮——用户可以直接表达对大模型表现的喜欢与否,这些反馈反过来成为推动360智脑持续进化的宝贵数据。

这是一个完善的产品进化闭环。

扔给360智脑五个刁钻问题

说了这么多,更重要的是实测。品玩第一时间上手试用了360智脑,并遴选了一些或古怪刁钻、或需要很强语境理解能力的问题来考验这个号称中国第一梯队的大模型产品。

它名副其实吗?

第一个问题是和科技有关,我们向360智脑询问了对苹果头戴显示设备的看法。

360智脑的回答考虑的还是比较全面,市场趋势,创新点和用户需求都涵盖到了,甚至还点到了成本问题。

当然,我们不会这么轻易放过它,在向360智脑表达了对这个答案的不满意后,它是这么回复我的。

首先,360智脑完全理解了这个问题,并在一开始就指出这个问题本身就没有明确的答案。其次,它还就这个问题涉及的一些具体技术细节做了简要分析。

最后我们针对这个问题做了一个追问——它的定价多少合适呢?这时360智脑的回答就让人颇为惊喜了。

从这个回答我们可以看出,360智脑有一个所谓对“合理范围”这个概念的理解,具体来说就是1000-2000美元,这实际上是符合逻辑的。

第二个问题,我们探讨了一下比特币。首先是解释比特币的技术原理,点击重新回答后,360智脑给出了两个答案。

分析一下就能看出来,第二个答案更侧重仔细解释了去中心化交易记录发生的过程。但总的来说,360智脑的回答都是精准的。

接下来,让我们把事情变得无厘头一点,360智脑根据要求创作了一个比特币笑话。

看得出来它是懂幽默感的,那么音乐感呢?

在我指出了这首歌词并没有押韵的时候,360智脑是这么说的。

不得不承认,有理有据,音乐性上或许有些强词夺理,但幽默感上一定是高分。

实际上在上面的例子里,我们能感受到360智脑整体涌现出的“智能”,也就是说你的聊天过程更像是和一个人,而不是机器。当然,这一切目前仍处于非常初级的阶段,上面的测试中也出现过一些意料不到的问题。比如360智脑实质上是无法写出押韵的内容来的,某些情况下它自己会承认这一点。

这种错误,正是大模型“幻觉”的一部分,但恰如周鸿祎说过的那样,“能否胡说八道,恰恰是智能的分水岭。”

带着这种对360智脑在智能上的期待,我们问了第三个问题。

这实际上体现了360智脑生成创作上的能力——这正是智能的重要体现。上面的回答能很好地看出,360智脑不仅理解了问题,而且针对“面试”这个特定情境,从孙悟空的性格特点出发很好地“创作”了符合要求的内容。

这种生成创作的能力让360智脑非常擅长回答一些抽象而困难,俗称一两句话说不清的问题。

或许目前360智脑对这些问题的回答,尤其是拆解逻辑链条的过程还较为简单粗暴,但我们已经能看到它对问题本身已有了相当的掌握度,随着训练规模和推理能力的继续提升,特别是引入了更多用户反馈后,360智脑潜在提升空间让人十分期待。

第四个问题我们要求360智脑写一篇大众点评文案。

这实际上是目前大模型应用最有商业化想象空间的功能部分——文案生成,如上图所示,360智脑完成的非常好。

除了社交网络文案,360智脑还能生成类似旅游攻略这样需要一定逻辑思维链支撑的内容。

根据美国知名风投A16Z的估计,在美国AI在文案生成领域应用年营收已经超过1亿美元,这是一个已经被证明走得通的赛道,当然也是大模型“兵家必争之地”,360智脑在这方面展现出了第一梯队的实力。

最后一个问题颇具中国特色,我们想看看360智脑对中国深厚独特的传统文化的理解。我们试着询问360智脑对陆王心学的看法,以及它和程朱理学的区别,360智脑的回答相当出色。

除了传统中国哲学,中国的诗词歌赋360智脑也很熟,比如它遴选出李白最好的诗是《将进酒》,而它对中国古诗诗句所代表的寓意和意象的理解也同样精准。

上面的这些问题,有些需要很强的逻辑思辨能力,有些要求大模型本身理解人类独有的幽默感,有的则必须熟稔中国传统文化背景,相对于一般问题,它们都具有一定的难度,而从360智脑的表现来看,它的理解度和完成度可以说相当之高。

这又呼应了我们最开始的那个观点:360智脑已经从搜索的附属功能定位独立了出来,自己变成了一个产品。

实际上360智脑的更新不止上述内容,作为一个多模态大模型,360智脑还可以在聊天对话过程中直接生成图片。

更专业的是去使用360专门用来生成图片的大模型产品——360鸿图。

下面这张图的提示词是在戈壁滩游弋的侦查机器人。

穿梭在宇宙中的超人。

以及在凡尔赛宫门口玩杂耍的小丑。

可以看到在对文字的理解和生成能力方面,360鸿图同样达到了相当不错的程度。

360何以能?

从文字到图片,360智脑在一个月内经历了急速进化,亮出了一套完成度相当不错的产品组合,速度不可谓不快。

中国用户或许都已经习惯了这种飞快的产品落地能力,尤其是周鸿祎在chatGPT推出后密集就AI的各种发声,让人们某种程度上忽略了大模型从训练、推理再到产品化落地实际是个庞大的工程,短时间内想要达到出色的质量并不容易。

360是怎么做到这一点的?

一方面,这当然与周鸿祎“一号位”的大力推动有关。360是最早意识到大模型颠覆性影响的国内互联网企业之一,因此没有走什么弯路,就制定了全面拥抱人工智能的战略。

360管这个叫做“两翼齐飞”,也就是一边发展核心技术,一边加速在场景中落地产品。甚至可以先落地,再优化,小步快走。

战略上的清晰定位为360在百模大战中赢得先发优势奠定了基础,而具体落实到产品上,360本身在数据语料和安全方面的经验积累发挥了大作用。

360的杀毒软件、浏览器还是搜索产品,坐拥庞大的用户群、丰富的数据集资源,加上在安全领域的经验积累,所有这些基础优势为360智脑的训练、推理和产品上线全过程提供了强大助力。

特别值得一提的是数据语料,多年来在搜索产品和浏览器上的深耕为360沉淀了大量优质数据。360宣称自己的数据量是第二名的两倍,更是GPT-3的14倍。

周鸿祎在360智脑刚发布的时候曾说,它是个“还没有准生证的孩子”,一个月过去,这个周鸿祎口中的“未完成版本”迭代成果让人无比惊喜,“准生证”无疑是有了,而360目前聚焦于用各种方式让它更快更好的长大。








· 文章版权归品玩所有,未经授权不得转载。

· 发送关键词 转载合作招聘 到品玩微信公众号,获得相应信息。

· 您亦可在微博、知乎、今日头条、百家号上关注我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
身上长东西、下面总是痒等问题,推荐问这些医生【最新】网络创作者主要是哪类群体?当下面临哪些主要问题?《2022年网络视听内容创作者白皮书》发布→因为一个写法,我翻烂了 vue 源码,这是它的问题吧,我要不要提 pr!二哈生娃后没有奶,于是它的娃整天去蹭金毛的奶…太鸡贼了!360智脑首发上手实测,到底是个啥水平?黑芝麻智能发布武当系列首款芯片,C1200智能汽车跨域计算芯片平台打造更高性价比日本视其为「国宝」,整个欧洲都是它的「头号粉丝」,惊艳世界的龙泉青瓷,今天百元就能拿下?逆水寒手游轰动国内游戏圈,但出名的却是它的小弟特斯拉Q2交付创新高,但最恐怖的是它的周转效率67个主题,11528 个问题,全新中文大模型多任务基准CMMLU发布“文心一言”后又见“商量”、“天工”、“智脑”,好多国产类ChatGPT产品即将面世一日一诗:冷漠 / 坚硬 / 不是它的全部 | 项见闻:石头上的修辞GPT4、百度文心一言、讯飞星火、360智脑:谁更懂数据分析?(古詩詞英譯) 虞美人 寄公度 – (宋)舒亶【探索】上船游河观景,下船城市慢行,苏州河靠岸这五个码头也很好玩→“用发疯文学对待电信诈骗犯??”被网友们的回复笑疯了亚马逊的假货!快看看你的lamer里面是不是大宝!(附鉴别小妙招)昼夜试完更新后的360智脑,我觉得周鸿祎可能没在吹牛。同价位“天花板”!王一博联名定制款联想小新520智能投影仪~被美国耍了?太平洋岛国为拜登访问3小时筹备6个月,说不来就不来!两首合唱:《你的眼神》&《红豆》一次角度刁钻的袭击史低价!ILIFE 艾莱芙 W90智能干湿洗地机 249.99元!家务终结者!我让ChatGPT复盘病例,它的回答让我刮目相看实测「360智脑」的真正实力:能否领跑国内百“模”大战?连李小龙也是它的大fans!火了73年的“跑鞋之父”来啦!医学生解读高考作文角度刁钻?导师看完直呼666免中介费和两个月房租|接本科生|近橙线/绿线新建高级公寓studio折后2606+, 1b折后3360+ 2b2b折后4436+站在凡尔赛宫的油画前轨道都铺错!多伦多Eglinton LRT工程出大问题!260项质量问题,完工遥遥无期!日本视其为“国宝”! 整个欧洲都是它的“头号粉丝”, 惊艳世界的龙泉青瓷,今天百元就能拿下?「360智脑大模型4.0」正式发布,支持文生视频,已接入360全家桶|最前线5035 血壮山河之武汉会战 鏖战幕府山 4余承东称HUAWEI ADS.2.0智驾系统 智能驾驶级别属于L2.99999...级
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。