Redian新闻
>
OpenAI:俩二;Google:四个王

OpenAI:俩二;Google:四个王

公众号新闻

又一次,OpenAI 身着华服表演了一个惊艳全场的魔术;但一转眼,Google 把秘籍指南和道具打了个包,来了个全员大派送。


果壳来到了 Google I/O 大会丨谷歌


是的,和 24 小时前那种仍然极具科幻感的炫示相比,今天在 Google I/O 开发者大会上的内容更能令每个普通人信服我们早已身处这个 AI 时代之中——当然,按照 Google CEO 桑达尔·劈柴的说法,“一个 Gemini 的时代”。


所谓“Gemini 时代”始于一年前,2023 年的 I/O 大会上,劈柴公布了这个模型。在之后的一年中,Gemini 不温不火,也没少遭遇一些啼笑皆非的争议(有些的确很尴尬)。


一年过去了,“搜索”变了,“谷歌助理”变了,连万年不变的“办公全家桶”都变了


  “蒸馏”一个大模型  


Google 说知道用户总“吵吵”别人家模型延迟小,成本低。于是这次,推出 Gemini 1.5 Flash 轻量级模型,速度更快,效率更高,从而能覆盖更多的用户。



Google 表示,就其模型尺寸来说,它对大量信息进行多模态处理的表现,还算不错。1.5 Flash 擅长总结,聊天,凝练图像和视频,从长文档和表格中提取信息。


Gemini 1.5 Flash 通过 1.5 Pro“蒸馏”得来,“知识蒸馏”是一种模型压缩技术,让小模型学习大模型,将重要的知识和技能迁移过来。


说到 Gemini 1.5 Pro,随着今天的 I/O 大会已经完全开放,覆盖 150 个国家,35 个语言,用户只要订阅了 Gemini Advanced,就能用上了。



Gemini 1.5 Pro(和1.5 Flash)支持 100 万 tokens 理解,是目前大模型服务中所能支持的最长上下文输入。


如果你不好理解,换算一下,大概是让它帮你总结 1500 页文档,或 100 封邮件。年底,这个数字将直接翻番,增至 200 万


很快,Gemini 1.5 Pro 就能处理一小时时长的视频,或者 30000 行的代码库了。它能充当“数据分析师”,从你上传的表格中“及时”发现洞察,构建自定义的可视化和图表。(你可以从桌面或 Google Drive 上传文件,你上传的文件是私有的,不会被用来训练模型。


全面接入 Gemini 的“谷歌办公全家桶”,也将在未来几个月内陆续上线“智能问答”、“智能邮件回复”、“表格图像化总结”等新功能。


推理上的进步具体表现在,改进了对模型对具体(特定)用例响应的控制,遵循用户复杂和微妙的执行,比如调整一个 Chat Agent 的角色风格,用多个函数调用自动化工作流,让用户通过设置系统指令,掌控模型行为。


Google 说,(Gemini Advanced)用户很快就能创建“Gems”了,这个 Gems 就是自定义化的 Gemini——无论你是想找一个瑜伽教练,为你制定食谱的营养学家,还是微积分导师(或者你有什么其他“奇怪的想法”),搞一个 Gems 就行了。


  无处不在的私人助理,正经的那种  


Demis Hassabis,DeepMind 的 CEO,第一次登上 I/O 大会的舞台,预示了重要信息的登场——崭新的 Google 智能助理。(如果没有 OpenAI 前一天的“截胡”,那就更“崭新”了)


从马上能让用户创建“Gems”的那个例子中,可以见得,为了让大模型“落地”,变得更智能,Google 想要 AI 助理都变得更个人化。


”Gemini 理应是你的私人 AI assistant,对话式的,用户友好的,有帮助的。“在 Google I/O “露脸”好多年的 AI assistant,总终于有了新名号,Project Astra。



Google 会给助理赋予哪些能力?


语音交互


AI 的语调和说话风格可调整;双方可自然对话,你也可以毫不客气地打断 AI 讲话。


Gemini Live 功能将上线 Gemini 移动端。很快,你在 Live 对话时,也能打开摄像头,让 AI 实时观察到你的周围。


在此之前,Google 会把 Gemini 放到 Google Message 做测试,推送到部分国家,让 Gemini 好好学学各种“社交技巧和礼仪。”


规划


“我妈喜欢海,我爸走两步就嫌烦,出行最好做高铁,因为恐高。他们隔天必吃一顿东北菜。入住酒店得干净,离交通近,性价比还得高。“就这样让 AI 生成一份三天海南出行计划,你说它懵不懵?


但现在的 Google 助理,除了具备精明的大脑(Gemini),还有强力的外部支持(这也是 Google 相比其他竞争者的最大优势之一,丰富的应用生态)。Google 将 Extensions(扩展功能)带入 Gemini,用 Gemini 打通并链接更多 Google 应用。


这一来,用户在 Google 应用和服务中的信息都能被调用,很多时候“只用一句简单的 prompt”,这些信息就能被链接起来。


这种共同协作让智能助理的规划能力成为可能。


记忆


在展示案例中,当使用者通过摄像头环顾办公室一周并持续提问交互之后,忽然提问“对了,我刚刚把眼镜放哪里?”助理准确地回答“放在一个苹果旁边。”而这个画面是大约一分钟前从摄像头中一闪而过的——我老板的助理可没有这么厉害。


  搜图算什么,我能搜视频  


Google 搜索的最大进化,被称为 AI Overviews,这个功能将“简化”用户提问,拥有更强大的多步推理能力——先将一个复杂问题,拆解成多个简单问题,再将简单问题拆解成多个关键词——反馈给用户的页面中,将是高度格式化的解释、简洁实用的行动指引、直接引导后续行为的链接等。



未来的搜索产品逻辑可能会被彻底颠覆,人们不需要一个单独的“搜索引擎”。未来 search 功能,也许会成为 Agent 功能的子集,比如让 Agent 做旅行计划,就会涉及到去 Google Maps 上搜饭店和评价。再进一步,想一下上述和 Agent 可能产生的各种互动,本质是都会是一种基于 AI 增强的搜索。



大会上还展示了应用内的搜索增强,名为 Ask Photo,比如在 Google Photo 中搜索“自己女儿学游泳的完整经历”,反馈的一些照片排列,能让每一个老父亲热泪盈眶,



远胜过搜图的另一种体验,Google 将支持通过视频提问的搜索,联想到修理师傅问你“到底是水管哪里漏了?”而你支支吾吾说不出,或是各种运动时的动作纠正,有些时候会比语言描述得更清。


  模型越大,责任越大  


每次聊到“AI 责任”,Google 可就精神了。


一款名叫 SynthID 的工具能很好地应对如今 AI 生成泛滥的问题。过去一年中,SynthID 可以识别 AI 生成的图片和声音,从今开始,还可以针对 AI 生成的文字和视频进行鉴别。基于这款工具和相应技术,Google 已经开始推进和高校与研究院所的合作,以应对 AI 生成内容在严肃科研领域被滥用的现象。


如果你还是在校学习中,这下慌不慌?


过去这一年,OpenAI 被各种“炸裂”或“赢麻了”,但Google 却在这次大会上说自己才“刚开始”,而我们,看热闹怎么会嫌事大?


作者:沈知涵

编辑:malt

如无特别标注,全文图片均来自谷歌


果壳AI组 出品


本文来自果壳,未经授权不得转载.

如有需要请联系 [email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
啥?Google搜索要删除加州的新闻?谷歌和加州杠上了......扔掉小红书,国外自由行:Pokémon Go 和 Google Gemini 帮助打造最强旅游 Copilot大厂动态丨Google、Tesla裁员不停,Apple捞人不止!市区West Loop房源WL05 | 不收中介费/距离Google500米/UIC750米/2b$32xx起OpenAI 与 Google,暂时没有赢家Google游戏高管演讲:坏消息“游戏已死”,但这三个方向还有希望...打败 Midjourney,这个 Google 大牛推出的 AI 产品凭什么弯道超车每周硅闻 | 20天内4轮裁员;Google被质问何时停止裁员;同为大厂,Microsoft重启加薪计划!法国南部特鲁斯OpenAI releases real大厂动态丨Google面试流程变了,一不小心就进冷冻期!宇宙巨大的环状结构Google NG全职岗开了,但……Google Glass 团队打磨 6 年的新产品,会是下一个翻车的 AI 硬件吗必争之地丨Google、Open AI又一次对阵,谁赢了?25、长篇家庭伦理小说《嫁接 下》第八章 此恨绵绵(2)Perplexity认为Google、Meta、马斯克和整个世界都在抄袭它熵泱——第四十四章好消息!西雅图Orca交通卡可加入Google Wallet,iOS用户再等等西雅图公交出行更便捷了!ORCA 卡 Google Wallet 上可用, 苹果用户还得等Google:2024年汽摩配市场洞察报告OpenAI隐藏“王炸”,这一次要革Google的命?Google 真的是堕落到没眼看了AI 接连翻车的 Google ,还能翻盘吗?商科首选Apple,工科青睐Google,我们钟意你黄仁勋每天都用的 AI 产品,来自 Google,颠覆 Google大厂动态丨Meta、Amazon、Google加速竞争,这些人才被疯抢!跟 OpenAI 争夺「iPhone 合作权」的 Google,后天要发布什么才能 「弯道超车」深度好文|真刺激!让ChatGPT,Google Bard和Microsoft Bing相互攻击,成功越狱生成违禁内容…Google 手机设计细节曝光,苹果三星都没它显眼|Google 工业设计总监专访221009aOpenAI 宣布终止对中国、朝鲜、俄罗斯等地区提供 API 服务,大家怎么看?八年级的半夜1点,google doc里热热闹闹精选SDE岗位丨Cognizant、Google、Boeing持续热招!OpenAI 首席科学家官宣离职/腾讯一季度净利润超500亿/Google 回击 GPT-4o,连发多款新品Google和OpenAI,又杠上了考点整理 | 无语!Meta、Google、Amazon的面试官竟这么出题?!Costco本周优惠:TCL 75英寸QLED 4K Google TV智能电视,$1349.99,省$1500!曾跟马斯克闹绯闻!Google创办人前妻"竞选美国副总统"挺突然呀,OpenAI CEO奥特曼和他的丈夫承诺捐出大部分财富
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。