Google 可以说是全世界最懂 AI 的公司之一,它用 AI 打败了围棋世界冠军,能翻译 133 种语言,还将智能手机推向了计算摄影,几乎所有 Google 产品的背后都有 AI 在驱动。但在最近两个月,Google 被 OpenAI 的聊天机器人 ChatGPT 抢尽了风头。可以像人类一样对话的 ChatGPT 让 AI 一词彻底出圈,人们对于 AI 的讨论已经从「AI 能做什么」慢慢转变成了「还有什么是 AI 不能做的」。就在昨天,微软宣布将会与 OpenAI 合作带来集成聊天机器人的新版 Bing 搜索和 Edge 浏览器,用 AI 带来全新的搜索体验。微软的意思很明显:它想要挑战 Google 作为「搜索一哥」的地位,并且要以对方最擅长的招式与之较量。手握 LaMDA、PaLM、Imagen 等 AI 技术的 Google 自然不会让微软这么轻易就抢占了 AI 应用的先机。在刚刚结束的 Google 发布会上,Google 展示了未来 Google Lens、地图、翻译以及最重要的搜索将会应用的全新 AI 技术,试图重新占领 AI 高地。其中,一同展示的 Bard 聊天机器人是对 ChatGPT 最有力的反击,这也宣告了搜索引擎即将进入聊天机器人大战的时代。现在,谁都别想温和地走进那个良夜。在介绍 Bard 之前,我们不妨先简单了解一下它所使用的 LaMDA 模型。Google 两年前发布的 LaMDA 模型在业内引发了巨大的关注,其影响力不亚于现今的 ChatGPT。LaMDA 是一种全新的 AI 架构,可以让机器学习变得更加简单、高效和更易扩展。它能够扩展到数千个节点,并且支持许多类型的机器学习任务,如图像识别、自然语言处理等等。通过训练,LaMDA 可以用接近人类水平的表达和理解能力与人对话。由于在聊天时 LaMDA 表现得太像人类,Google 的一名工程师甚至认为它已经有了「自我意识」,并因此闹出了不小的风波。这也是 Google 这段时间一直没抢占聊天机器人先机的其中一个原因:不是没能力做,只是 LaMDA「疯」起来连 Google 自己都会害怕。不过 Google 还是低估了人们对于 AIGC 的接受程度,ChatGPT 的突然爆红给 Google 敲响了警钟,于是乎 Bard 应运而生。在发布会之前,Google 的 CEO 桑达尔·皮查伊(Sundar Pichai)就已经在博客上预告了 Bard 的存在。Bard 基于一个轻量版的 LaMDA 模型运行,Google 称这样可以降低 Bard 所需的计算能力,使之能够拓展到更多的用户,进而获得更多的反馈。和停留在 2021 年的 ChatGPT 不同的是,Bard 接受的信息来自于最新的互联网,因此 Bard 能够为当下所发生的事情提供解答,对比两者能够检索的信息量的话,Bard 比 ChatGPT 大了一个量级。换句话说,爱范儿以后再跟发布会应该都不用熬夜码稿了,直接让 Bard 输出一份发布会总结即可。根据 Google 在发布会上的展示,用户可以直接用自然语言向 Bard 提问,而不用像过去那样用关键词搜索。如果你想要购买一台新车,可以直接向 Bard 提问有什么汽车适合你的家庭,Bard 从预算、安全性等角度给出不同的购车建议。如果你更喜欢新能源汽车,Bard 还会联系上下文给出新能源类型的建议。这也是 Bard 的特点:多角度回答问题,以及强大的上下文理解能力。未来 Bard 还会被集合在 Google 搜索之中,更快速地提供答案。例如在 Google 的 Demo 展示中搜索了「观星时能看到的最棒的星座是什么?」的问题,Bard 会一同展示多个星座的特点以及观测的方法。Google 认为,人工智能在回答问题时并不存在唯一的正确答案(No One Right Answer),因此 Bard 从多角度回答用户的问题、帮助用户迅速了解大局的回答方式,比像 ChatGPT 那样只提供一个唯一的、看似正确的答案的做法要更好。从 Google 公布的演示来看,Bard 与其说是聊天机器人,倒不如说是个搜索助手,它更专注于解决自然语句搜索难、不准确的问题,以及如何更好地归类整合搜索结果,减少人们的搜索成本。至于 Bard 有没有像 ChatGPT 那样强大的文本生成能力,目前还很难从有限的展示中判断。用户们最关心的问题来了—— Bard 什么时候才能用呢?Google 表示目前 Bard 还处于内测阶段,在未来几周内会向公众开放,届时爱范儿也会第一时间上手体验。Google 翻译可能是 Google 除了搜索外最多人使用产品之一,根据 Google 公布的数据,全世界有超过 10 亿人都在使用 Google 翻译来了解这个多元化的世界。为了帮助人们更好地理解和使用陌生的外语,Google 翻译现在除了会提供单词的译意,还能提供更多的背景和相关信息,例如同时展示多个同义词、例句等等。该功能将会支持英语、法语、德语、日语和西班牙语共 5 种语言,预计在未来几周内推出。Android 端的 Google 翻译也会用上更具可读性也更好用的全新设计,更简便的操作逻辑让翻译这件事变得轻松简单,出门在外遇到语言不通时也可以从容处理。Google 称未来也会对 iOS 端的 Google 翻译作重新设计。Google 翻译更新的另一个重要的功能是利用 AI 学习能力可以更精准地翻译图片上的外语文字,并且可以将翻译过来的文字与图片背景重新混合成一张新的图片,比 iOS 的实况文本功能还要更进一步,Google 强调实现该功能需要 6GB 以上的 RAM。早在 2021 年公布的 Immersive View 功能,现在有了更精细的建筑模型,而且渲染范围很大,真正把整个地球搬到云上。同时,Immersive View 还结合了天气系统,会根据天气预报进行环境渲染,沉浸感十足。今天起,该功能将在伦敦、洛杉矶、纽约、旧金山和东京上线,未来数月,还有更多城市跟进。看到这个演示我单方面宣布,今天开始《地球 OL》正式上线。虽然这只是玩笑话,但这对元宇宙赛道而言,确实是极大的进步。另一项元宇宙「基建工程」,是将现实世界和虚拟元素有机结合,也就是人们常说的「增强现实」,Google 地图也同样照顾到了,不过目前还只是在手机上应用。在街上,你举起手机,四处环顾,屏幕上会显示出店家名称,点进其中一个商家,能查看到包括营业时间、客人评分、评价在内的内容。这并不算创新,但支持这项功能的城市逐步扩充,最终虚拟与现实之间的那座桥,将正式完工。到那时,在 AR 眼镜上获得类似的体验并非难事。或许那时候,Google Glass 将复活,完成它的未竟之业。Google 还在发布会上宣布 Google 地图 AR 导航功能将支持全球 1000 多个机场,方便旅人更精准地找到目的地。另外 Google 终于开始重视起新能源车主,针对内置 Google 地图功能的新能源车辆,日后将上线充电站的推荐功能,电车用户的福音。不过中国车企和地图服务商早已上线类似的功能,功能还相当完善,Google 在这方面,还需多加跟进才行。在人工智能与摄像头相结合之前,手机镜头只能用来拍照摄影,但在人工智能时代,手机上的摄像头逐渐代替了人眼,有了识别世界的能力。在这一基础上,Google Lens 应运而生,包括商品识别、实景翻译、植物识别、文本识别搜索等工作,都是 Google Lens 的职责所在。在全新 AI 模型的帮助下,Google Lens 也迎来突飞猛进的发展。首先是 Search your Screen 功能,我愿称它为「所见就能得」的全新诠释。比如你在小红书上看到一款非常可口的蛋糕,不用跳出当前 app,长按电源键唤醒 Googel 智能助理,点击 Search screen,即可找到这种蛋糕的信息,再搭配新推出的「混合搜索(multisearch」功能,就能搜索附近能买到这种蛋糕的地方,及时满足口腹之欲。这个「混合搜索」功能,能在图片识别的基础上,用文本进一步微调你所要搜索的内容,进而得到更精准和多样的结果。有点像图片版的 ChatGPT,只不过缺少了连续对话的能力,最终得到的结果,不一定能让人次次都满意。不过在这项小更新中,我们也能看到 Google 在自然语言模型上的潜力,它或许能比 ChatGPT 更早提出全能型的 AIGC 工具,然而不是今天。Google 的高级副总裁 Prabhakar Raghavan 在开始介绍更新之前,提出了一个你可能会感到诧异的观点:搜索目前依然是一项「登月工程」。
搜索引擎如今已经非常成熟,是绝大部分互联网用户日常使用的基础工具,它是如此地简单、易用、直观——只有一个搜索栏,想要知道什么就直接输进去再点击搜索。
但也正是搜索的使用方式非常简单,使得要在此基础上想要不增加用户使用负担的同时增大搜索的准确率变得非常困难。搜索引擎要付出大量看不见的努力,才能让你在搜索时穿越层层无用的信息,找到答案。
Google 已经在搜索领域耕耘了 25 年,依然不能保证用户每一次搜索都能找到想要的信息,因此引入 AI 辅助搜索对于改善用户体验、避免不必要的重复搜索尤为关键。
Prabhakar Raghavan 认为 Google 正在帮助人们摆脱单一的搜索方式和语言的限制,跳出搜索框去探索更大的世界,并且重塑了搜索的意义,而这只是一个开始。
那么用户对于 Google 给出的这张 AI 化答卷满意度如何?从股票上来看,截至发稿前 Google 的股价下跌了 7.76%,如果 Google 要想继续坐稳「搜索一哥」的地位的话,Bard 需要比 ChatGPT 更先一步改变搜索引擎。
点击「在看」
是对我们最大的鼓励