我们在现场见证了一场AI成年礼

2023-05-11 07:05

估计大家已经被各种 AI 应用冲击得趣味疲劳了吧——无论是忽然声名赫赫的 OpenAI，还是每天被花样繁多的生成式 AI 应用搞得眼花缭乱，更不用提一下子各种“GPT”大乱斗……

在一顿尝鲜和试用之后，极尽各种调戏之外，忽然觉得怅然若失：你说它没用吧，确实能时不时地给你来上些惊喜；你说它多有用吧，频繁地胡说八道、繁琐地调教训练，最烦的还是在一条任务中不停地跳转各种页面和应用……

简洁又沉浸的操作、完整全面的场景生态，以及一个言而有信对自己负责的表现，是人们对生成式 AI 近在眼前的期待，就像是期望一个青春期的少年快快成熟长大。

我们去现场啦丨作者提供

在 5 月 10 日的 Google I/O 大会（Google 最重要的年度开发者大会）上，看上去更靠谱的 AI 来了：PaLM 2 模型发布，Bard 开放自由使用，并接入 Google“全家桶”应用，新安卓系统整合进更多的 AI 实用功能……

虽说 AI 靠谱，但发布会暖场看起来是蛮不正经的丨作者提供

虽迟但到，被 OpenAI 以及各种 GPT 拉进“AI 新时代”之后，直到今天很多人才想起一家多年前就保持“AI First（AI 为先）”的公司。

Google I/O 现场丨作者提供

来点真格的一条龙服务！

Bard（你可以简单理解为 Google 的 ChatGPT）发布两个月了，这次它迁移到了 PaLM 2 模型之上——这也是今天 Google I/O 大会的发布重点。

相比上一代模型，PaLM 2 拥有更强的推理和编程能力，而且进行了超过 100 种语言的文本训练。

大会现场展示了一段用 PaLM 2 生成代码，然后自动添加韩语批注｜Google

大会现场就展示了一段用 PaLM 2 生成代码，然后自动添加韩语批注，然后又自动优化修改的全自动流程。这对于说不同母语的程序员之间协作起来，很友好。

PaLM 2 有大小轻重不同的四种版本可选，分别被命名为：Gecko（壁虎）、Otter（水獭）、Bison（野牛），和 Unicorn（独角兽）。

PaLM 2 四个量级版本丨Google

目前有两个已经精调训练好的专家版本：专注安全的 Sec-PaLM 和专注医疗健康的 Med-PaLM 2——这也是目前对于 AI 人们最期待的，也最重要的两个应用领域。

据称，Bard 将很快支持 40 种语言（包括中国和中文）｜Google

迁移到它之上的 Bard 首先是开放了免费自由访问（之前需要排队），支持超过 180 个国家和地区，按计划将很快支持 40 种语言（包括中国和中文）。

新公布的 Bard 功能中包括了“给图”和“读图”：比如你问它去某某城市哪里好玩，它的回答就也会包括各个景点名胜的照片，甚至地图标记，你也可以让它把这些景点生成旅行计划表格；再比如你发给他一张图，让它给你编一句搞笑的描述或台词，也没问题。

Bard 可导出丨Google

最实用的是，Bard 在每个对话框下面增添了一个导出按钮（目前可以选择内容导出到 Google 邮箱和 Google 文档应用，以后还将接入图表、网盘、地图等等）——想想自从“用 AI 武装了自己”，是不是最烦的就是频繁地在各种页面和应用之间来回切换？这下好了，胡编报告、自动写作业、发邮件怼老板……一气呵成、无缝连接。

文生图功能演示丨Google

大会上还展示了未来将接入 Bard 的第三方应用，比如前一段火热的 AI 绘画工具 Adobe Firefly：对 Bard 说“绘制一张斗志昂扬的老板鼓励大家疯狂加班的插画海报”，几秒之后就大功告成（对于生成内容会同时遵守 Google 和 Adobe 双方的质量和道德标准）。

把 AI 装进手机

还记得一年前，当你尝鲜那些需要本地部署的 AI 绘图工具时电脑力不从心的样子么？现在在手机安卓系统上就能实现 AI 绘制手机桌面背景了（它甚至还会帮你优化提示词）。

AI 绘制手机桌面丨Google

你看，自己还没来得及被 AI 武装起来，手机都武装起来了。要是觉得 AI 画桌面大材小用了，那让它帮你自动回复信息怎么样？大会上展示了安卓系统中 AI 自动根据消息上下文进行回复的功能，你还可以加入特定的“风格和语气”设定：模仿 HR 跟老板智斗上几个回合，想想就刺激……

另一个实用功能是手机上 P 图：美颜、优化、打字等等早就过时了。既然叫了这么多年“智能手机”，那有了 AI 才是真智能：Google Photo 新公布 Magic Editor 功能，可以直接实现对图像特定部分的编辑，人物、背景都可以，而其他部分会自动通过 AI 补充到理想又逼真的样子。什么“背景太假啦”、“构图太差了”再也不是情侣分手的借口。

用上 Magic Editor 后，可以把图中的椅子拖拽到自己满意的位置，还能让 AI 将天空变得更蓝一些丨Google

搜索算是 Google 老本行。属于这个 AI 时代的搜索，让你可以像前面提到的那样通过 Bard 对话来进行，也可以在传统搜索引擎中实现一种更新的体验：通过 Google 搜索框，你可以输入极其复杂的一句话来获得准确的搜索结果（之前你可能要不停地把你问题拆分或者把限制条件拆分）：比如“对于我这种又懒又想探索大自然户外运动旅行的人在带着 80 岁腿脚不便的老奶奶和 3 岁的娃以及两条狗的情况下应该在即将到来的端午节假期去什么地方旅行？”

图文并茂的搜索回复丨Google

搜索引擎会充分理解这个长句，然后在结果中给出带有预览的网页答案，还会自动提供引导问题，比如：假期玩多久？可以住哪里？交通怎么安排？等等。

而与此同时，AI 模型还会主动筛选掉那些虚假的和恶意诱导类型的结果。

这种体验被 Google 成为“搜索实验室”，今天就正好开放注册（labs.google.com/search），你可以试试排队等待体验。

“大胆而负责的”

成熟负责的第一步是能够承担自己的行为和后果，对于 AI 来说也一样。

同样是关于搜索，Google 会在图片搜索中加入一个名为“关于此图（About this image）”的工具——它可以将所搜所得图片中有用的背景信息显示，包括图片首次在互联网上出现的时间和地点、有哪些网站出现过此图（主要会包括严肃新闻网站、事实核查网站与大众社交网站），很多虚假照片会在这些信息中被轻易识别。

让 AI 为自己负责丨Google

大会现场就以“登月是假的、照片是摆拍”的所谓“摆拍图”来展示了这一功能。

对于那些 AI 画出来的图，无论是否足以乱真，Google 的搜索结果中也会自动识别，并增加一个“由 AI 生成”的标签。这些都来自于 Google 开始强调在图片中加入“水印”和“元数据”，“水印”用来表示一副图片最原始的版本，任何编辑修改都无法使其改变，而“元数据”则用来标识图片的最原始信息，以便准确溯源。

对于所搜得出的文字内容，Google 在一部分需要的搜索问题之下加入了一个新的 Perspective Filter（“视角”过滤器）。在这个过滤器处于打开状态的时候，搜索结果会优先把来自真实经历的内容放在更靠前的位置，而那些没什么关联通过关键词蹭热度的、那些低质量看似相关又不知所云的、那些虚假的无法被求证的，都将被“过滤”。