国际科技财经博客移民网络热点娱乐民生时事公众号

>

2023 ICML大会来了！一文速览谷歌DeepMind的最新研究

2023 ICML大会来了！一文速览谷歌DeepMind的最新研究

公众号新闻

2023-07-25 05:07

新智元报道

编辑：Lumina

【新智元导读】第四十届ICML开始了！谷歌DeepMind投中了80多篇论文，让我们看看都研究了些什么？

2023年的国际机器学习大会（International Conferenceon Machine Learning，简称ICML）在夏威夷檀香山举办。

ICML是由国际机器学习学会（International Machine Learning Society，IMLS）主办的年度机器学习国际顶级会议之一。

ICML创办于1980年，每年6月中下旬举行。今年的议程安排在7月23日星期日到29日星期六。

大会关注的领域涵括计算机视觉、统计和数据科学到机器人技术，目的是将人工智能 (AI) 社区聚集在一起，分享新的想法、工具和数据集，并建立联系以推动该领域的发展。

今年是ICML举办的第四十届会议，大会录用了1827篇论文。谷歌 DeepMind 的研究人员今年在ICML上发表了80多篇新论文。

谷歌在这次会议上报告的主要亮点有：

具有社会目的的机器学习、预测蛋白质结构的AlphaFold模型、具身语言模型PaLM-E、文本生成视频的Phenaki模型等。

除了这些，谷歌还将在会议上重点介绍模拟世界中的人工智能、强化学习的未来研究以及人工智能的前沿挑战中谷歌所做出的贡献。

下面，就来看看谷歌在这三个方面都做了哪些研究吧！

模拟世界中的人工智能

我们现在看到的能够成功进行读取、写入和创造的人工智能，如ChatGPT等，是在大量的数据集上训练的基础模型。

这些基础模型在监督和自监督学习中表现出了优越的适应性和可扩展性，但到目前为止，这些成功尚未完全转化为强化学习（RL）。

这意味着以基础模型为底层运行逻辑的人工智能将难以理解复杂的现实、处理现实中的任务。

谷歌研究人员在这项工作中，证明了大规模训练 RL 智能体会产生一种通用的上下文学习算法，该算法（AdA）可以像人类一样快速地适应开放式新颖的具体现实问题。

AdA是一种人工智能代理，可以像人类一样在模拟环境中适应解决新问题。

它可以承担具有挑战性的任务：以新颖的方式组合物体、导航看不见的地形以及与其他玩家合作。

此外，谷歌的另一项研究展示了如何使用视觉语言模型（VLM）来帮助训练智能体。

通过简单的提示让VLM控制监督信号，教导智能体在 3D 渲染环境中根据新物体的名称（例如平面）或特征（例如颜色）与新物体进行交互。

这些研究将为日益通用和自适应的强化学习智能体奠定基础，使这些智能体在更大的开放领域中表现更好。

强化学习的未来研究

为了开发负责任且值得信赖的人工智能，必须了解这些系统的核心目标。

在强化学习中，定义系统核心目标的其中一种方法是通过奖励。

理查德·萨顿（Richard Sutton）提出的奖励假设认为，所有目标都可以被认为是最大化预期累积奖励。

谷歌研究人员解释了假说成立的确切条件，并阐明了强化学习问题的一般形式的奖励可以（或不能）捕获的目标类型。

另外，谷歌还在研究中提出：在部署人工智能系统时，需要考虑模型对现实世界的适应性。

因此，谷歌了研究如何在约束条件下更好地训练强化学习算法，因为人工智能工具通常必须受到安全性和效率的限制。

还探索了如何在不确定的情况下通过不对称的信息游戏（例如扑克）来教授模型复杂的长期策略。

在会议上，谷歌将会演示模型如何在不知道其他玩家的位置和可能的行动的情况下赢得双人游戏。

等会议开始，谷歌会玩出什么花样，就让我们拭目以待吧！

人工智能的前沿技术

现有的人工智能基本上都是在一系列打包好的数据集上进行训练的。像最近大火的大语言模型（LLM），它们能够学习并预测语言符号之间的联系，却很难真的理解语言所指的现实世界。

而人类却可以轻松地学习、适应和理解我们周围的世界。

开发能够以类人方式进行推理的先进人工智能系统，将有助于创建可以在日常生活中使用的人工智能并应对新的挑战。

谷歌在人工智能的适应性方面，研究了人工智能根据新信息快速改变其预测和推理的神经网络的可塑性及其损失的原因。

另一篇论文是研究在统计数据自发变化的数据源（例如自然语言预测中）上进行元训练的神经网络。

论文回答了当前的序列预测模型和训练机制可以在多大程度上解释大型语言模型中出现的上下文学习类型。

此外，谷歌DeepMind的研究人员提出了一个新的循环神经网络 (RNN) 系列，它们在长期推理任务上表现更好。

研究人员对标准RNN进行了改进，包括线性化和对角化递归，使用更好的参数化和初始化，并确保前向传递的正确标准化。

循环神经网络

最后，在人工智能的强化学习研究中的「分位数信用分配」（quantile credit assignment），谷歌研究人员提出了一种将训练中的运气与技能分开的方法。

通过在行动、结果和外部因素之间建立更清晰的关系，人工智能可以更好地理解复杂的现实环境。

除了以上重点介绍的研究，还有很多其他的研究.....

80多篇论文实在太多辣！小编截不过来了.....感兴趣的就自己去看吧！

附上网址：https://deepmind.events/events/icml-2023/resources#

一路下来，这些研究真是让人眼花缭乱，让人知(tou)识(yun)大(nao)涨（zhang）！

参考资料：

https://www.deepmind.com/blog/google-deepmind-research-at-icml-2023

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

炸裂！最新CVPR2023、ICML2023、AAAI2023、ACL2023论文+Code大合集！47岁DeepMind创始人斩获“诺奖风向标”！2023拉斯克奖出炉，AlphaFold上榜一文速览ICML 2023测试时自适应/在线学习相关论文俄乌战况11 2023 樱花之约（四）琵琶湖和夜樱谷歌联合创始人回归做AI；ChatGPT上线自定义指令功能；DeepMind迭代AI设计芯片方法丨AIGC大事日报谷歌 DeepMind 打破十年算法封印，AlphaDev 惊世登场，颠覆人类算法格局！回国之旅，手机失踪了 OpenAI 又赢麻了！谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4，OpenAI 的挖人大计就出炉了 2023 GenAI硅谷峰会！来和独角兽创始人、OpenAI Deepmind Nvidia大牛面对面交流 Tour de l’ile de Montréal 2023 谷歌AGI机器人大招！54人天团憋7个月，强泛化强推理，DeepMind和谷歌大脑合并后新成果假如移民生活（10）公园里的华裔老人 DeepMind新研究：ReST让大模型与人类偏好对齐，比在线RLHF更有效 AlphaDev将排序算法提速70%！C语言库作者一文详解DeepMind最新AI 防火防盗防闺蜜一文速览ICML 2023域自适应/域泛化相关论文 LLM in Medical Domain: 一文速览大语言模型在医学领域的应用比人类算法快70%！谷歌DeepMind用AI改进数据排序，登上Nature wow! Tom Hanks Presidential Harvard Speech Motivational Inspirat Transformer+强化学习，谷歌DeepMind让大模型成为机器人感知世界的大脑碾压GPT-4！谷歌DeepMind CEO自曝：下一代大模型将与AlphaGo合体 DeepMind等摘得杰出论文、IBM超算深蓝成经典，IJCAI2023奖项公布一文速览大语言模型在分子领域中的探索谷歌DeepMind打破十年算法封印，AlphaDev惊世登场，颠覆人类算法格局！ICML 2023杰出论文奖放榜！北大校友一作斩获大奖，华人作者参与三篇，DeepMind苹果纷纷获选 AI帮助人类打破十年算法瓶颈：谷歌 DeepMind 发现更快排序算法，已集成到C++库谷歌DeepMind发布机器人大模型RT-2，提高泛化与涌现能力｜甲子光年 DeepMind推出AI图像识别工具；华为Mate 60 Pro接入盘古大模型；传谷歌Gemini算力达GPT-4五倍谷歌AGI机器人大招！54人天团憋7个月，强泛化强推理，DeepMind和谷歌大脑合并后新成果｜GGView 成功预测90%错义突变，DeepMind团队开发新AI模型AlphaMissense，有望解决人类遗传疾病的最大挑战人为什么会衰老 (2023 DeepMind最新研究登Nature，揭示AI时代科研新范式，开拓未知领域，带来全新挑战机器人可“自我学习”！谷歌DeepMind发布首个机器人算法模型，“潘多拉魔盒”打开了？GPT-3.5逆袭GPT-4！谷歌DeepMind华人天团，让LLM像人类一样制作工具，完胜CoT 《虞美人 - 柳边蝶》前哨速览：SpaceX招聘14岁软件工程师，DeepMind推出新的Alpha AI工具不用LLM，遗传编程可控Python代码！谷歌DeepMind等提出全新ARZ框架｜IROS 2023 10行代码媲美RLHF！谷歌DeepMind用游戏数据让大模型更像人类

热点事件追踪