Redian新闻
>
大模型逐鹿AI搜索,「天工」跑在了前面

大模型逐鹿AI搜索,「天工」跑在了前面

科技

机器之心报道

机器之心编辑部

颠覆数字世界的基础,大模型的第一波应用在这里?

最近一段时间,科技领域的新产品都讲究个「大模型加持」,技术竞争进入了白热化,不论谷歌、微软还是 Meta 仿佛瞬间都回到了自己年轻时的样子。


随着技术的快速发展,越来越多的人开始讨论大模型的应用。在落地上,首当其冲的就是谷歌一直有着主导地位的搜索。


在 ChatGPT 发布不久之后,占据先手优势的微软放出的第一波大模型应用产品正是搜索引擎。北京时间 2 月 8 日凌晨,微软发布重大公告,争分夺秒的宣布将大模型技术引入到自家的搜索引擎中。


这一次,数十年处于霸主地位的谷歌搜索,感受到了微软新必应带来的「震感」,也让我们看到了 AI 搜索引擎成为了大模型技术落地应用的战略要地。


近日,国内公司昆仑万维加入了「AI 搜索引擎」的这场逐鹿之战,宣布推出国内第一款融入大语言模型的搜索引擎 —— 天工 AI 搜索,并开启内测申请且上线了 App。



内测链接:tiangong.cn


在这篇文章中,我们就来看下,天工 AI 搜索如何挑战传统搜索?实际用起来效果又如何。


为何始于搜索?


为何早早发布「天工」大语言模型的昆仑万维,将大模型技术在 C 端的第一款产品落在搜索引擎场景?


最终原因,还是在于搜索的重要性与大模型技术带来的革新潜力。


由于技术的快速迭代,很多科技公司提出了「基础模型」,开发者根据自身的需求可以在其之上构建商业应用,不过基于它们实现的大规模工业转型,效果还没有显现。


但在消费级领域,生成式 AI 似乎拥有更加明显的应用前景。从今年 2 月开始,微软、OpenAI、谷歌和百度等先行者的行动看来,不约而同地把大模型的能力引入到自家的搜索引擎当中,受到了人们的欢迎。


大模型时代来了,我们的生活会发生哪些改变?在看到过 ChatGPT 的震撼效果之后,我们都对此进行过或是严肃或是夸张的想象,有一个共识是:它可能会在科技公司的产品上无处不在,越是需要与计算机互动的工作,颠覆就会越强烈。



在与计算机互动的过程中,搜索引擎是基础且「无感」的应用。长期以来,搜索几乎没有出现过明显的形态变化,人们也越来越倾向于选择头部几家服务。


大模型问世后,传统搜索可能会被颠覆,这个格局有机会被打破:通过结合质变之后的 AI 技术,过去以关键词为起点的搜索动作,已变成了发出指令「让人工智能干活」,我们不再需要思考检索的方式,或是在搜索结果中繁琐地筛选可能有用的内容或是入口,AI 会一站式地解决问题。


通过大模型特有的思维链(CoT)能力,新一代搜索系统可以充分理解人们提出的问题和找到的内容,分析你的意图,和你进行持续有效的互动,生成有意义的内容。


简单来说,AI 现在已经有了点「逻辑」,它可以真正作为我们的个人助理,因为满足大量复杂的需求而成为流量入口,也可以作为初步的生产力工具解决工作上的问题。


基于大模型的搜索能力,我们可以期待在不远的未来,对于信息的需求会获得极大满足,让 AI 整合资料能大幅提升知识获取的效率,而 AI 生成则可以用以前无法想象的速度完成任务。


另一方面,一个可以充分理解人类意图的 AI 也能连接各种服务,让行程制定、会议纪要不再需要时间,随着不断使用,它还会变得越来越聪明。


如果存在这样的大模型应用,它难道不就是我们心心念念的,可以帮我们与这个世界打交道的「超级 APP」?


全量 AI 搜索体验,而且更方便


既然已经有产品上线,那么它的具体效果如何?


作为参加内测的首批用户,机器之心第一时间试了试天工 AI 搜索的成色。一番体验下来, 我们切实感受到了与传统搜索引擎的不同之处。


这款 APP 名叫「天工 AI 助手」,新用户下载就能体验,如果是老用户,也只需要更新 APP 就能体验。它的用户界面设计很简单:在搜索框中点进去,就可以问自己想要了解的任何问题了。另外,利用「AI 对话」功能,你还可以体验与天工 AI 助手聊天互动、创作文本等常规大模型的能力。


我们知道,传统搜索引擎主要是以关键词为导向的,输入文字后得到与关键词匹配的海量结果,以关联程度为顺序排列(不考虑广告的话)。但这种方式有时未必就能给你真正想要的答案,毕竟即使是论文也存在标题党,而如果搜索一长段话,搜索引擎很少会考虑输入内容的逻辑。


天工 AI 搜索主打的是自然语言搜索,就是用大白话进行提问,不用遣词造句,或是使用信息检索课中提到的「操作符」,想怎么问就怎么问。天工 AI 搜索不仅能轻松分析并 Get 到你的真实意图,还能捕捉到问题中的上下文关系,使搜索结果更精确、更相关。


它也大幅度改变了搜索引擎输出结果的逻辑,简单给出一个问题就可以看到,天工 AI 搜索的界面从上到下分成了三个部分来呈现,分别为参考、回答和追问



这正是天工 AI 搜索与传统搜索的不同之处:它首先会展示出参考信息源,并且这些信息源是对回答问题最具参考价值;然后基于 AI 大模型能力对参考内容概括总结,去除冗余和关联不大的信息,更高效、准确地生成简明扼要的回答。


作为搜索结果(回答)中引用信息源的参考,是天工 AI 搜索的第一大亮点。这些列出的参考保证了回答是可以追溯和值得信赖的,通过对应的索引让你直接链接到原始信息。参考信息源也很丰富,不仅有新闻网站、知识问答平台,还有机构官网、视频等。


来到最底部,则是天工 AI 搜索的「追问」功能,体现了搜索引擎大模型的一面,它可以让你围绕一个问题展开 20+ 轮次的深度交互


搜索引擎的特点在于能针对你的需求输出即时准确的信息,而大模型的强项是打破了人机之间的壁垒,可以和你有效进行对话,充分理解上下文内容,并给出准确的回应。


接下来我想了解一下谷歌在 2017 年发表的那篇影响了自然语言处理(NLP)发展方向的大作。天工 AI 搜索给到了这篇论文的题目、架构原理以及产生的影响,简直像是对论文做了一个摘要总结。



我们继续追问,在 NLP 领域里曝光率极高的 Transformer 早已经扩展到了计算机视觉领域。谷歌在视觉 Transformer 领域的工作 Vision Transformer 有哪些厉害的地方呢?天工 AI 搜索让我们了解到 ViT 相较于传统卷积和循环神经网络的优势、更出色的建模能力和更强的可解释性,以及为计算机视觉领域带来的积极影响。

 


当初写 Transformer 论文的几位作者,现在已经都算是大神了吧,他们都怎么样了?那就接着往下问。

 


由此可见,天工 AI 搜索的无限追问赋予了你我「打破砂锅问到底」的能力,一件事情的来龙去脉都可以在它那里找到答案。


除了通过追问让你化身「万事通」之外,天工 AI 搜索在大模型的加持下具备强大的信息整合、提炼和串联能力,从而在应对开放式问题时更加游刃有余、答之有物。


这次我来问一个目前大模型领域没有定论的热点话题,开源还是闭源?看看天工 AI 搜索会给我们什么答案。它的回答首先点明不能一概而论,然后详细罗列了开源和闭源的优势,最后建议企业和研究机构根据自身情况选择开源或闭源,可以说非常全面了。

 


大模型的搜索引擎不仅能接得住追问,而且还能拿捏很多细节。天工 AI 搜索在知识类、创意类搜索方面更是强于传统搜索。


比如给出下面一个编程题目,它会先进行解释,再输出代码实现。当然解法的来源链接也都列好了。

 


另外你也可以基于这个结果进行追问,一步步了解这个代码的原理。


再来一个创意类的问题,比如我想利用生成式工具 Stable Diffusion 和 Runway 创作一部科幻大片,但不知道怎么做。天工 AI 搜索给出了非常详细的准备步骤,可见要比自己总结快得多。

 


接着追问,我想写一个以海洋遭到核污染导致人类灭亡为主题的故事,但不知道如何创作剧本。同样交给天工 AI 搜索,回答依然条理清晰、逻辑性强。


 

实时性是搜索引擎的重要要求,天工 AI 搜索在这方面做出尤为出色,它用整个网络作为资料库保证了输出的实时性。


比如我想了解一下 Meta 上周五发布的代码大模型 Code Llama,以及在它的基础上超越 GPT-4 的大模型。从天工 AI 搜索那里,我们知道这个超越 GPT-4 的大模型是 WizardCoder 34B 以及它的一次生成通过率。

 


最后,天工 AI 搜索非常友好的一点是每轮次的搜索结果都不会丢失,保存在「我的历史」中,以便你随时回看搜索内容。并且,所有客户端都是统一的。


天工大模型和 AI 增强技术


看起来挺好用的天工 AI 搜索,背后应用了哪些技术?它的最重要依托是昆仑万维此前推出的千亿级大语言模型「天工」。


作为国内首个对标 ChatGPT 的双千亿级大语言模型,「天工」部署在国内领先的 GPU 集群上,整合了千亿级预训练基座模型与千亿 RLHF 模型。因此,模型拥有了强大的自然语言处理和智能交互能力,在丰富的知识储备加持下,可以满足知识问答、文案创作、逻辑推理、数理推算、代码编程等多样化生成式 AI 需求。


昆仑万维表示,利用大模型能力,新一代搜索引擎正在变得更加聪明。另一方面,基于搜索的实时内容,大模型在内容生成时幻觉等现象出现的概率也被降低。在天工 AI 搜索的背后,昆仑万维在多个角度进行着重改进,革新了传统搜索引擎的体验。


具体而言,提升主要体现在五个方面:


意图识别和理解:传统搜索引擎中,用户经常需要多次尝试搜索语句。天工 AI 搜索在检索前会使用大模型对用户问题做 Query 改写,不仅可以深入地挖掘用户真实意图,还能准确捕捉到查询中的上下文关系,带来更加精确和相关的搜索结果。


智能摘要:在开放式问题上,通过「Dense Passage Retrieval」(DPR)技术,利用双编码器模型对问题和潜在相关文档(例如维基页面或论坛文章)进行编码、计算相似度,确保准确检索到高相关性文档及关键段落。


向量语义检索:昆仑万维为搜索引擎构建了一套大规模实时向量检索系统,并在搜索的多个环节发挥作用,包括精准内容定位、增强内容多样性、提升上下文连贯性等。通过召回用户之前查询的搜索结果,提高搜索结果与用户交互的连贯性,打造了一种更自然、流畅的搜索对话体验。


 

智能追问技术,它为天工 AI 搜索的无限追问提供了支持。昆仑万维表示,该技术的核心是充分理解用户的查询,并在需要更多信息时提出追问。追问的实现不仅离不开「意图识别、信息完备性检测、问题生成、用户反馈接收、动态调整与学习、上下文感知」等步骤,还需要对话、用户查询日志、追问反馈等大量数据持续训练。当然也需要不断迭代和优化,通过准确把握用户多遍需求,使回答始终不偏题。


此外,天工 AI 搜索也实现了跨语言的检索(Cross-LanguageInformation Retrieval,CLIR),即使你提问时使用的是中文,AI 生成内容时寻找的信息也并不仅是中文,但呈现结果时全部都已翻译并整合好了。这种方式不仅大大扩展了搜索的知识边界,也确保用户能够接触到最新、最全面的全球资讯和研究成果。


更重要的一点是,天工 AI 搜索会自动过滤收费网页和无效信息,也没有广告,排在前面的都是有效参考链接。


在这些能力的加持下,AI 搜索既能看懂你的长难句,也能从全球的网络中搜罗信息,整理出逻辑清晰的答案,如果获得了你的反馈还能不断改进。一个能够解决所有问题的万能 AI 已经初具雏形。


或许,超级应用的开始就是这个样子。


点击左下方阅读原文,申请加入天工AI搜索内测。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
拼多多APP上线本地生活入口,群雄逐鹿万亿市场!百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报北京内推 | 百度搜索策略部招聘生成式大模型/搜索排序方向算法工程师50年历史国际运动品牌!「踩屎感」跑鞋,仅100多元入手!台南「麻省理工」竟是赌场 警带回33名「师生」究办盘点深度价值基金经理的「同工」和「异曲」Meta版ChatGPT来了:Llama 2加持,接入必应搜索,小扎现场演示50年历史国际运动品牌!千元级「踩屎感」跑鞋,仅100多元入手!大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱TikTok逐鹿东南亚电商市场 | 经济学人(请珍惜每天的推送,也许今天就是最后1天)Bao女士失踪近1个月!警方暂停搜索,嫌疑男子明天出庭!体验完这个国产AI搜索,我想说传统搜索引擎可以靠边了。《雨巷佳人》&《我记得你眼里的依恋》B站内测AI搜索,马斯克回应限流推特,华为申请疑似问界LOGO商标,QQ Windows全新体验版上线,这就是今天的其他大新闻!5104 血壮山河之武汉会战 浴血田家镇 12最新!紧急延长避难令!海陆空全州搜索,缅因州特大枪击案18死,枪手留下字条“消失”!高盛实习第一天打开Google搜索,被老板痛批不专业坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」《老和尚的身教》百度肖阳:大语言模型重构搜索引擎,让搜索越来越懂用户国内大模型北京占一半;李开复大模型创企官宣;文心一言App上架苹果应用商店丨AIGC大事日报诺贝尔奖颁给 mRNA 开创者;微软纳德拉:谷歌垄断搜索,苹果也有责任;亚运会中国队拿下 DOTA2 冠军 | 极客早知道王小川谈中国大模型:年底将有3.5的能力,有机会跑在美国前面十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型独家|北京奢侈品牌门店大升级,谁冲在了最前面?传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报天工大模型登顶多模态榜单!解决幻觉、跨语言两大难题看到她也开始佩戴它,有点傲娇,第一次时尚走在了明星的前面最高法院的给了平权行动猛烈一击有用吗?GPT-3.5 Turbo推出微调功能;昆仑万维天工AI搜索引擎内测;阿里云等联合发布教育大模型国内首款AI搜索,为何出自昆仑万维?现实会跟偶像剧一样,「青梅竹马」永远打不过「天降主角」吗?老海归金蝉脱壳波特兰教师决定「11月1日开始罢工」超40000学生停课!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。