Redian新闻
>
人类反超 AI:DeepMind 用 AI 打破矩阵乘法计算速度 50 年记录一周后,数学家再次刷新

人类反超 AI:DeepMind 用 AI 打破矩阵乘法计算速度 50 年记录一周后,数学家再次刷新

公众号新闻

作者 | 李梅、施方圆

编辑 | 陈彩娴

10 月 5 日,AlphaTensor 横空出世,DeepMind 宣布其解决了数学领域 50 年来一个悬而未决的数学算法问题,即矩阵乘法。AlphaTensor 成为首个用于为矩阵乘法等数学问题发现新颖、高效且可证明正确的算法的 AI 系统。论文《Discovering faster matrix multiplication algorithms with reinforcement learning》也登上了 Nature 封面。

然而,AlphaTensor 的记录仅保持了一周,便被人类数学家打破了。

来自奥地利林茨约翰·开普勒大学的研究人员 Manuel Kauers 和 Jakob Moosbauer 在其最新工作中表示,他们已经打破 AlphaTensor 的矩阵乘法记录。他们开发了一种以 95 步执行 5×5 矩阵乘法的方法,比 AlphaTensor 的 96 步记录少了一步,此前的记录为 98 步。论文预印版于 10 月 13 日发布在 arxiv 上。

论文地址:https://arxiv.org/abs/2210.04045

论文标题中的 “FBHHRBNRSSSHK”其实就是 DeepMind 论文所有作者姓氏的首字母组合,这种命名方式也是很有趣了:

数学问题的探索永无止境,如作者所说,DeepMind 算法方案 “still not the end of the story”。不过,他们这次的突破是站在巨人也就是 AI 的肩膀上,作者表示,其解决方案是在 DeepMind 方案的基础上应用一系列的转换,从而消除了一步乘法计算。



1

前进 2 步的 AlphaTensor

我们先来简要回顾一下 AlphaTensor 的成绩。

计算机科学中许多数学任务都是通过矩阵乘法来处理的,例如机器学习、计算机图形的创建,各种模拟或数据压缩。而计算机计算乘法的速度要远远慢于加法,因此,即使矩阵乘法的效率提升得很小,也会产生巨大影响,几十年来,数学家们一直在寻找更有效的矩阵乘法算法。

1969 年,德国数学家 Volker Strassen 开发了一种算法,首次将 4×4 矩阵乘法的求解从 64 步减少到 49 步,震动了数学界。

而 Deepmind 这次发布的 AI 系统 AlphaTensor,发现了一种比 Strassen 算法更快的新算法。Demis Hassabis 称,新算法具备在每天数万亿次计算中将效率提高 10% ~ 20% 的潜力。

AlphaTensor 是一次从游戏到数学的飞跃,它基于 2018 年 Deepmind 发布的通用棋盘游戏 AI 系统 AlphaZero。为了训练 AlphaTensor,Deepmind 研究团队将矩阵乘法问题转化成一种 3D 棋盘游戏,每一步都会产生新算法的构建块。AlphaTensor 每次会在数万次移动中进行选择,以尽可能少的步骤生成新算法而获得奖励。Deepmind 将其称为“张量游戏”。

在 5×5 的输入矩阵中,AlphaTensor 独立发现了 Strassen 算法和其他已知的算法。并且,它还开发了比旧算法更有效的新算法。

例如,5×5 矩阵乘法(n=4)以前要计算 80 步,而 AlphaTensor 新算法只需 76 步;当n=5 时,AlphaTensor 将求解从原来的 98 步减少到 96 步。4×4 矩阵乘法由 Strassen 减少到 49 步,AlphaTensor 则将其优化到 47 步。这样的效率是由 AlphaTensor 生成的 70 多个矩阵乘法的算法实现的。

图注:AlphaTensor 发现的算法复杂性与已知矩阵乘法算法比较

此外,AlphaTensor 还可开发特定硬件的算法,用于机器学习。据说目前运行速度比谷歌 TPU 和英伟达 V100 上的算法快 20%。

自主调整乘法算法以适应硬件的方法对人类来说很困难,所以 AlphaTensor 对 Strassen 算法的改进创造了 4×4 矩阵乘法的新上限,是 AI 进步为其他学科提供助力的一大证明。它也表明,原本为传统游戏开发的 AlphaZero 系统可以解决领域之外的数学问题。



2

人类再向前 1 步

在 Manuel Kauers 和 Jakob Moosbauer 的最新研究中,他们主要有两个新发现,一是对于 4×4 矩阵,他们提出了另一种 47 步乘法的求解算法,但不同于先前的解决方案;二是对于 5×5 矩阵,他们首次提出了一种需要 95 步乘法的方案。

在这篇文章中,作者简单展示了这两个矩阵乘法的方案,不久后将发表正式论文,更详细地介绍求解算法的搜索技术。

4 × 4 矩阵的新方案共包含 47 次乘法,如下:


5×5 矩阵(n=5)的 95 步乘法方案如下:


考虑到 GPU 每天要进行万亿次矩阵计算,所以从 98 步到 96 步以及从 96 步到 95 步这样看起来很小的增量改进,实际上能大大提升计算效率,可以让 AI 应用程序在现有硬件上运行得更快。
作者介绍:
Manuel Kauers,林茨约翰内斯开普勒大学的代数教授,该大学代数研究所的负责人。其研究兴趣是计算机代数、符号求和和积分、特殊函数恒等式等。
Jakob Moosbauer,林茨约翰内斯开普勒大学代数研究所博士生。

参考链接:

1.https://the-decoder.com/deepmind-alphatensor-record-for-matrix-multiplication-held-for-a-good-week/

更多内容,点击下方关注:
扫码添加 AI 科技评论 微信号,投稿&进群:

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
终身致力于数学教育的美国数学家说,与现实脱节的数学课,对99%的学生都没有用DeepMind携AlphaCode登Science封面,写代码能力不输程序员数学启蒙|提升计算速度,试试这些小技巧,亲测有效!再掀强化学习变革!DeepMind提出「算法蒸馏」:可探索的预训练强化学习Transformer11岁发现数学新定理,13岁登日本数学会学术会议,学界大佬:他是「可敬的数学家」AlphaTensor横空出世!打破矩阵乘法计算速度50年纪录,DeepMind新研究再刷Nature封面,详细算法已开源DeepMind 创始人 Demis Hassabis:AI 的强大,超乎我们的想象7 Papers & Radios | 无残差连接训练深度transformer;DeepMind写代码AI登Science封面埃及艳后KleopatraAI求解偏微分方程新基准登NeurIPS,发现JAX计算速度比PyTorch快6倍,LeCun转发:这领域确实很火智能体觉醒自我意识?DeepMind警告:当心模型「阳奉阴违」pseudo-HaikuDeepMind再登Nature封面!推出AlphaTensor:强化学习发现矩阵乘法算法硬核观察 #781 DeepMind 用游戏的方式打破了矩阵相乘 50 年来的记录如何高效实现矩阵乘?万文长字带你从CUDA初学者的角度入门那年火车上的故事(六)(心事)硬核观察 #760 DeepMind 研究员论文称 AI 将消灭人类LeetCode 力扣官方题解 | 537. 复数乘法英伟达首席科学家:5nm实验芯片用INT4达到INT8的精度,每瓦运算速度可达H100的十倍英伟达“春晚”上菜!RTX 40系显卡发布、“雷神”超级计算机,再次刷新科技极限马斯克点赞!DeepMind神AI编剧,一句话生成几万字剧本强化学习发现矩阵乘法算法,DeepMind再登Nature封面推出AlphaTensor2022傅雷翻译出版奖获奖者揭晓 Le palmarès du Prix Fu Lei 2022 dévoiléDeepMind新作!无需权重更新、微调,Transformer在试错中自主改进!谷歌大裁员前奏?DeepMind全面冻结实习生招聘!有人面试前1小时才收到通知DeepMind 最新发文:AlphaZero 的黑箱打开了DeepMind用「强化学习」训练「正能量」聊天机器人:再也不用担心AI乱说话了!DeepMind新作:无需权重更新、提示和微调,transformer在试错中自主改进毛泽东肃反AB团,激发出“富田事变”#关于攀岩的一切#见证团队走向世界全网最详细!油管1小时视频详解AlphaTensor矩阵乘法算法AI写剧本炸场戏剧节!DeepMind出品,马斯克看了直夸,网友看到接口悟了50年悬而未决的矩阵乘法难题,被DeepMind的新式算法攻克了DeepMind提出通用神经算法学习器,排序、搜索、动态规划全部解决
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。