北京时间5月11日凌晨,谷歌2023年度开发者大会Google I/O拉开帷幕!比起去年强调“整合全球信息,使人人都能从访问中受益”的使命,在今年I/O大会中,谷歌将更大的权重交给了人工智能,不但推出了全新一代的超级语言模型PaLM 2,还将AI新功能整合进Android 14,并将其辐射到了谷歌旗下各个应用(搜索、地图、Gmail等)中去。
作为世界上最具影响力、最强大机器学习技术的开发者,谷歌展示过很多人工智能方面的进步。虽然此前因为微软和OpenAI的优异表现,谷歌已经被唱衰了很久,但谷歌在这届I/O开发者大会上的发力,让我们看到了这一科技巨头将会继续引领人工智能行业的决心。(谷歌CEO Sundar Pichai)
为了稳固在人工智能行业的领军地位,谷歌在此次大会上直接更新了他们在去年4月刚刚发布的超级语言模型PaLM,定名PaLM 2。该模型支持全球100多种语言,在数学、编码、推理、多语言翻译和自然语言生成上的表现都更加出色。谷歌同步发布了PaLM 2技术报告,根据基准测试,对于具有思维链prompt或自洽性的MATH、GSM8K和MGSM基准评估,PaLM 2的部分结果超越了GPT-4。谷歌工程师声称PaLM 2的语言能力已经“足以教授某门语言”,原因是其训练数据中的非英语文本更为普遍。在这个全新的超级语言模型PaLM 2的帮助下,谷歌几乎所有的业务都可以快速的引入人工智能。目前,PaLM 2已经应用在25种功能和产品中,其中包括AI聊天机器人Bard,以及谷歌文档、幻灯片和工作表等。值得一提的是,PaLM 2最轻量版本Gecko小到可以在手机上运行,每秒可以处理20个token,大约每秒16或17个单词。其中谷歌Bard聊天机器人在迁移到PaLM 2模型后,整体的能力提升明显,谷歌宣称凭借改进的数学、逻辑和推理技能,Bard现在支持了超过100种以上的语言,可以帮助生成、解释和调试20多种编程语言的代码。除了PALM 2,谷歌还宣布了正在训练的全新基础模型Gemini,这是第一个多模态模型,同样包含了参数大小不同的模型。(图源网络)
发布会上,谷歌还宣布了一个重磅消息——Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。这次,Bard上新了不少功能,用户目前可以更简便地把生成的文本导出到谷歌文档和Gmail,可视化搜索,以及深色模式等等。此外,和Adobe的AI图像生成功能,以及Instacart和OpenTable等第三方服务的功能整合也正在路上。目前,谷歌正在使Bard变得更加可视化,让Bard能够分析图像,并且能在查询结果中提供图像信息等等。
(图源网络)
3、Android 14引入AI:可实现主动式文本生成此次谷歌赋予了Android 14两个全新的AI功能,一个是主动式的文本生成(Magic Compose),一个是生成式的壁纸。谷歌在Android的信息服务中引入了名为Magic Compose的功能,AI可以根据消息内容生成回复文本,这个功能很接近之前谷歌推出的助理服务(google assistant),只不过这次是通过AI完成文本对话上的主动生成服务。
谷歌还通过引入文本转图片扩散模型,允许用户输入一些语义提示,描述想要获取的图片信息,系统将会自动生成相应的壁纸。谷歌还表示,它有一种新的“电影壁纸”(cinematic wallpaper),使用设备上的机器学习网络将图片转换为3D图像,配合手机的重力感应器,壁纸可以实现3D动态的效果。
另外谷歌在此次主题演讲中,带来了一个重要的生态升级,设备查找应用“Find My Device”将很快可以利用其他Android设备构建的网络去帮助用户寻找设备。谷歌明确表示这些设备的网络信息都是加密的,他们无权查看相关设备信息,以确保用户的隐私安全得到保证。
4、Pixel折叠屏手机发布:搭载谷歌自研Tensor G2处理器
谷歌推出了在折叠屏形态的智能手机产品诞生4年后,首个由谷歌这个Android系统母公司设计生产的折叠屏手机,谷歌将其命名为Pixel Fold。Pixel Fold是一款横向内折屏幕手机,整体设计类似于OPPO Find N的小折叠,展开后宽高比更加的接近。这台手机折叠后的机身尺寸139.7x79.5x12.1毫米,展开后尺寸139.7x158.8x5.8 毫米,重量为283g。
Pixel Fold 搭载谷歌自研的Tensor G2处理器,附带Titan M2协处理器,配有12GB LPDDR5内存+256/512GB UFS 3.1存储,拥有4821mAh的双电芯电池,以及USB Type-C 3.2 Gen 2 接口 ,支持最高30W的有线快充和Qi标准的无线充电,机身支持IPX8的防水等级。
谷歌为这台折叠屏打造了一个独特的功能,当开启实时翻译时,手机的内外屏可以同时开启,显示不同的语言,可以让使用者实现快速实时的翻译交流。影像方面,谷歌Pixel Fold外屏配有一颗1000万像素的镜头,内屏配有800万像素的镜头,后置4800万像素主摄(OIS)+1080万像素的超广角+1080万的等效五倍长焦。
(图源网络)
此外,谷歌还推出了全新的平板电脑产品——Pixel Tablet。谷歌表示目前他们所有的第一方原生应用,都可以在这台设备上实现分屏的操作。这台平板的定价为499美元,谷歌同时发布了一个支持磁吸充电的扬声器底座,如果购买这台平板电脑,这个价值129美元的充电扬声器底座会随机附赠。
(图源网络)
今年3月,谷歌宣布为其Workspace办公套件增加了一系列AI功能,以追赶微软的 Microsoft Copilot 服务。在I/O大会上,谷歌将其命名为Duet AI,称其为“AI驱动的合作者”。谷歌还推出了一项名为“Sidekick”的新功能,该功能能够阅读、总结和回答不同谷歌应用程序中的文档问题。在会上,谷歌展示了Duet AI的部分能力。Duet AI会涵盖谷歌的各种办公软件,包括在文档和Gmail中的写作辅助、幻灯片的图片生成、Meet的自动会议摘要等等。进一步来看,上下文的关联性也会更严谨且更接近人类真实的笔法,另外它还可以帮助用户修饰词汇,让邮件读起来更加的生动或者是温婉。
(图源网络)
谷歌在今天也推出了由PaLM 2驱动的全新搜索引擎,它势必会在未来很短的时间内,改变用户使用互联网搜索引擎的传统模式。Google的搜索业务副总裁Liz Reid在现场展示了嵌入AI之后的Google Search功能,她在搜索框中输入了“为什么酵母面包仍然如此受欢迎?”谷歌搜索就给出几段详细描述酵母的味道、其益生元能力的优势等等。另外,在生成内容旁,给出了3个链接,以证明摘要中的内容。在AI生成答案之后,谷歌倾向于给出佐证,让人们了解到AI是如何生成这样的描述的。Liz Reid说这是谷歌AI主动生成模型与众不同的关键。“我们希望大语言模型在生成内容后,作为必要条件,它要告诉使用者有哪些资源可以阅读更多相关的信息”。
(图源网络)
除了搜索之外,谷歌旗下两个最著名的应用“Gmail”和“Google Maps”也获得了AI的加持。Gmail继续升级内置的AI工具,从最初的Smart Reply到Smart Compose,而最新版本升级到“Help me write”。“Help me write”通过引入生成式AI来帮助用户撰写邮件,而且还有多种语气供用户挑选。谷歌地图可以展示你在陌生城市的主动路线规划,比如你要跑步,谷歌的AI可以帮你规划两条跑步路线,其中可能有一条是海边的跑步路线,同时它还能告诉你未来一段时间的天气情况和交通信息,帮助你更好的跑步。这个功能将在包括阿姆斯特丹,柏林,都柏林,佛罗伦萨,拉斯维加斯,伦敦,洛杉矶,迈阿密,纽约市,巴黎,旧金山,圣何塞,西雅图,东京和威尼斯在内的15个城市上线相应的能力。(图源网络)
基于PaLM 2能力的基础编码模型Codey,谷歌为Android的开发者们推出了一个全新的AI编程机器人——Studio Bot。它不仅可以生成代码、修复BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持Kotlin和Java编程语言,并将直接嵌入到Android Studio开发工具的工具栏中。谷歌表示,这个机器人的开发完成度仍处于“非常早期的阶段”,他们将继续对其进行培训以改进其编程和答案生成的能力。它目前也只能通过Canary频道提供给美国的开发者,还没有准确的在全球推出的时间表。(图源网络)
9、基于AI主动生成技术的Magic Editor基于人工智能主动生成技术,谷歌在I/O大会上推出了一个名为Magic Editor的图片编辑功能,它使用生成式AI帮助用户对照片进行大幅度的编辑和重构。用户只需要描述需求,这项功能就可以自动帮助用户调整照片中需要修改的部分。在演示过程中,谷歌展示了这项功能对照片更换天气,抹平衣服上的褶皱,甚至是将被拍摄主体从照片的边缘挪到图片中心来,AI会自动补齐缺失的图像。谷歌表示该功能将于今年晚些时候在Google Photo推出。10、Project Tailwind:AI笔记本
Tailwind是一个有趣的个人化人工智能模型,从本质上讲,它是一个根据使用者提供的文档进行训练的AI笔记本,用户可以像导师或合作伙伴一样进行其主动写作的文档。虽说谷歌把这个功能其定位为学生服务的工具,但是对于日常需要处理大量文本的打工人来说,也是重大利好。
谷歌产品管理高级总监Josh Woodward表示,它的工作原理是你可以简单地从谷歌云盘中挑选文件给AI去学习,它能有效地创建个性化和私密的人工智能模型,该模型在你提供的信息方面具有专业知识。
(图源网络)
👇👇👇
今年的I/O大会,全面拥抱人工智能成为更大的主题,谷歌此次展示了多种AI和相关业务的结合,也让我们看到了AI在未来科技领域的潜力。
此外,谷歌在今年的主题演讲中,也多次提到了AI伦理的问题,在同步发展大模型人工智能的同时,严肃看待人工智能的伦理问题,将会成为未来所有大模型研究者必须面对的问题。
内容来源:https://io.google/2023/intl/zh/
|点击关注我们 👇 记得星标|
欢迎添加小编微信,链接一线创业者、投资人,进入全球高端科技创投交流群!2023年,硅谷高创会将在美国(硅谷、波士顿、纽约、西雅图、洛杉矶、华盛顿、芝加哥、亚特兰大等城市)、新加坡、德国、法国、以色列、日本、韩国等地组织企业家开展考察,促进优秀企业家、投资人、创业团队及政府代表与世界知名企业零距离接触,扩宽视野,寻觅合作,开拓市场。
硅谷高创会2023年企业家全球出海商务考察详细安排及背景介绍请点击蓝字链接查看:
1、探访伦敦证券交易所、剑桥科技园等,揭秘英国科技创新与金融管理发展趋势 | 英国商务考察团正在招募
为充分满足各地、各层次企业海外商务考察需求,硅谷高创会正在招募城市合伙人/合作伙伴,通过与合伙人达成的全方位、多层次的合作,为各地企业提供持续深化且个性化的商务考察服务,实现共赢。若想成为城市合伙人,请扫码联系小助手,备注【合伙人】具体咨询。
工业和信息化部工业文化发展中心主办,北京高创汇智科技有限公司承办,北京大兴国际机场临空经济区管理委员会联合承办,北京大兴区投资促进服务中心支持,共同开展的“专精特新”企业创新特训营第一期在北京大兴成功举办!
欢迎各位朋友扫码添加工作人员微信(备注专精特新合作/报名),报名下一期“专精特新”企业创新特训营或成为城市事业合伙人。