微软副总裁兼CTO Kevin Scott专访：人工智能的未来之路！

公众号新闻

2022-12-27 05:12

新智元报道

作者：微软亚洲研究院

编辑：好困

【新智元导读】如今，从为软件开发人员生成代码到为图形设计师绘制草图，由大型语言模型驱动的人工智能系统正在改变人们的工作和创作方式。

近期，微软执行副总裁兼首席技术官 Kevin Scott 就人工智能对知识工作者的影响以及人工智能下一步发展等话题分享了他的看法，核心观点包括：

人工智能大模型和生成式人工智能的发展将继续提高人们的生产力、创造力和满意度。
人工智能将助力实现科学突破，并帮助世界解决一些重大挑战。
随着人工智能模型的平台化，以及微软继续以负责任的方式为客户推动人工智能的进步，云、基础设施投资和以极其负责任的方式发展人工智能变得至关重要。

下面就让我们一起来看一看 Kevin Scott 对人工智能未来之路的展望吧！

问：在你看来，今年人工智能领域最重要的进步有哪些？

Kevin Scott：当我们进入2022年时，我想人工智能领域的几乎每个人都期待在接下来的12个月左右的时间里能发生引人瞩目的大事。现在，这一年马上就要结束了，即使当初的期望颇高，回顾我们在人工智能领域各个方面取得的创新规模依旧令人兴奋。科研人员和其他同行们为推进前沿技术所取得的成果，仅在几年前都几乎是无法想象的。而几乎所有这些都是人工智能大模型飞速发展的结果。

今年有三项成果让我印象最为深刻。首先是 GitHub Copilot 的发布，这是一个基于大型语言模型的系统，它能将自然语言提示词转化为代码，给开发人员的工作效率带来了非常积极的影响。未来的发展将在很大程度上取决于我们编写软件的能力，因此 GitHub Copilot 史无前例地让更广泛的人群可以拥有编码技能，这一点非常了不起。

第二个是 DALL∙E 2 等生成式图像模型广受欢迎且变得更易使用。素描、绘画以及掌握所有的平面设计、插图和艺术工具都需要相当高超的技能。像 DALL∙E 2 这样的人工智能系统尽管不能把普通人变成专业的艺术家，但它给了很多人视觉表达的能力，一种他们从未想过自己会拥有的全新超能力。

我们还看到，人工智能模型变得越来越强大，并为其所要解决的问题带来了更多实质性的收益。纵观今年整个科技行业，我认为蛋白质折叠方面的研究非常出色，包括微软与华盛顿大学蛋白质设计研究所大卫·贝克实验室利用 RoseTTAFold 所做的项目，以及利用一系列先进的人工智能技术帮助其开展变革性的工作。任何能对科学和医学有增效作用的事情对世界都是有益的，因为我们面临的最大、最棘手的问题就在这些领域中。

2022年是一个令人印象深刻的科技大年。我认为明年会更好。

问：你认为接下来几年，人工智能技术在哪些方面会产生最大的影响？

Kevin Scott：我可以很有把握地说，2023年将会是人工智能领域有史以来最激动人心的一年。之前我也曾真心实意地相信2022年是有史以来最令人激动的一年。创新的步伐一直在快速向前。

前面我已经谈到了 GitHub Copilot，但这也只是人工智能大模型潜在能力的冰山一角，如果把同样的理念外推到各种不同的场景中，那么我们就可以帮助到编程以外的其他脑力劳动。整个知识经济将会见证人工智能如何帮助人们解决工作中的重复性问题，并让工作更愉快、更有成就感。这将适用于几乎所有的工作，比如设计新分子来创造药物、根据 3D 模型设计制造「配方」，或者是单纯的写作和编辑。

例如，我一直在使用一个我基于 GPT-3 为自己构建的实验系统，来帮助我完成一件从十几岁起就想做的事情——写一本科幻小说。我的笔记本上写满了我为设想中的书编写的概要，描述了书中的大致内容和这些故事将发生在什么样的宇宙中。如果我用传统方式写书，一天能写2000个字，我就会觉得自己很不错了。但有了这个工具，我就可以打破僵局，我经常可以一天写出6000个字，这对我来说已经很多了。与之前相比，这是一个更加充满活力的过程。

这就是「一切皆有副驾驶（copilot for everything）」的梦想——当你做任何类型的认知工作时，都会有一个「副驾驶」坐在你身边，它不仅可以帮助你完成更多的工作，而且还能以新颖有趣的方式增强你的创造力。

问：这种生产力的提高显然也会提升满意度。为什么这些工具能给工作带来更多乐趣？

Kevin Scott：我们所有人都需要使用工具来完成工作。其中一些人非常乐意获得、掌握这些工具，并且弄清如何以超级有效的方式用它们来做事。在很多情况下，人们已经有了全新、有趣且从根本上比以前更有效的工具。我们做过一项研究，发现使用无代码或低代码工具对用户的工作满意度、总体工作量和员工士气产生了80%以上的积极影响，特别是对那些处于相对早期阶段的工具，这是一个巨大的好处。

对于一些员工来说，这实际上是在强化工作的核心流程，它会让你加速。就像穿着一双更好的跑鞋去跑步或参加马拉松。我们发现这正是开发人员使用 Copilot 时的体验，据他们反馈，Copilot 可以帮助他们保持心流状态，并且在面对曾经看起来枯燥重复的任务时依然头脑清醒。当人工智能工具可以帮助人们消除工作中的苦差事，也就是那些重复的或令人讨厌的或妨碍他们做真正喜欢的事情的工作，毫无疑问这会提高满意度。

就我个人而言，这些工具让我可以比以前更长久地处于心流状态。创意流的天敌是分心和思维停滞。例如，当我不太清楚该如何解决下一个问题，或者下一问题是「我得去查一下这个问题，我不得不从正在做的工作中切换出来，去解决一个从属性问题。」这些工具越来越多地为我解决了这些从属性问题，我则可以一直保持在心流状态中。

问：计算技术和硬件的突破如何促进人工智能的进步？

Kevin Scott：我们在人工智能领域看到的几乎所有最新进展背后的根源，是我们验证了模型规模的重要性。事实证明，基于更多数据和更多计算能力训练出来的模型具有更丰富和更通用的能力。如果想继续推动这一进步——需要明确的是，目前我们还没有看到扩大规模所带来的好处的边界，我们要做的是尽可能优化和扩展计算能力。

两年前，微软推出了第一台 Azure AI 超级计算机，在今年的 Build 开发者大会上，我曾说我们现在拥有多个超级计算系统，而且我们非常确信这些系统是当今全球规模最大、功能最强的 AI 超级计算机。我们和 OpenAI 使用这些基础设施来训练我们几乎所有最先进的大模型，其中包括微软的图灵（Turing）、Z-code 和 Florence 模型，以及 OpenAI 的 GPT、DALL∙E 和 Codex 模型。最近，我们还宣布与英伟达（NVIDIA）的合作，打造一台结合了 Azure 基础设施和英伟达 GPU 的超级计算机。

这其中的一些进展就是通过使用越来越大的 GPU 集群实现大规模强力计算而取得的。然而，更大的突破或许在于软件层，它优化了模型和数据在这些巨型系统中的分布方式，既可以训练模型，又可以让这些模型为客户提供服务。如果我们希望将这些大模型作为人们可以用来创作的平台，那么它们就不能只被世界上极少数拥有足够资源来建造巨型超级计算机的科技公司所使用。

因此，微软对一些软件进行了大量的投入，例如用 DeepSpeed 来提高训练效率，用 ONNX Runtime 来加速推理。这些软件针对成本和延迟进行了优化，可以帮助我们让这些人工智能大模型更容易为人们所用，也更有价值。我为我们的这些技术团队感到自豪，因为微软在这一领域确实处于行业领先地位，而且我们对所有这些成果都进行了开源，以便其他人也能够不断提升。

问：与这些进步相伴的是人们对「人工智能将影响就业」的担忧。你如何看待人工智能和就业的问题？

Kevin Scott：我们生活在一个异常复杂和宏观经济历史性变革的时代，展望未来5到10年，我们需要全新的生产力形式，让所有人都能够继续享受进步。我们希望将这些人工智能工具打造成平台，人们可以使用这些平台来构建业务和解决问题。我们相信，这些平台可以让更多的人使用人工智能。而有了这些平台，我们就能解决更多的问题，就会有背景更加多元的人们参与到技术的创造中来。

此前，人们需要大量的专业知识才能开始人工智能的实例化。但现在你可以调用微软 Azure 认知服务和微软 Azure OpenAI 服务，并在这些服务的基础上构建复杂的产品，而你不必是 AI 方面的专家，也不需要从零开始训练自己的大模型。

随着所有这些巨型人工智能系统的不断增长和演进，我想我们可以预期，这些进步将从根本上改变工作的性质，每个领域被影响的程度会有所不同，在某些情况下甚至还会创造出大量以前没有的新工作岗位。回顾过去可以看到，历史上重大的技术范式转变都伴随着相同的情况：电话、汽车、互联网。我认为就像这些例子一样，我们需要用新的方式思考工作和技能，并专注于确保我们有足够的人才且接受过培训，能够承担起真正关键的工作。

问：除了 GitHub Copilot 和 DALL∙E 2 之外，人工智能还以其他方式出现在了微软的产品和服务中。那么下一代人工智能如何改进 Teams 和 Word 等现有产品？

Kevin Scott：这是一个人工智能不为人知的故事。迄今为止，人工智能带来的大部分益处都分散在1000种不同的地方，你甚至可能都没有意识到你获得的产品体验中有多少来自机器学习系统。例如，在 Teams 视频通话功能的系统中，所有这些参数都是通过机器学习算法学习的；音频系统有抖动缓冲器使沟通顺畅；屏幕上显示的模糊的背景效果也是机器学习算法在起作用。有十几个机器学习系统协同工作，才让我们的交流体验变得更加愉快。而整个微软公司的产品和服务都是如此。

我们已经将机器学习的应用从几个地方扩展到遍布不同产品的上千个场景，从 Outlook 电子邮件客户端的运作、Word 中的文本预测、必应（Bing）搜索的体验，到用户在 Xbox Cloud Gaming 和 LinkedIn 中看到的信息流是什么样的，无处不在的人工智能正在让这些产品变得更好。

过去两年发生了很大变化的一件事是，曾经我们需要为所有产品针对每项任务专门定制一个模型，现在一个模型可以用在很多地方，因为它们拥有了很强的泛化性。能够投资于这些随着规模扩展而变得更强大的模型，然后让所有构建在模型之上的东西同步受益于你所做的改进，这是十分了不起的。

原文链接：

https://mp.weixin.qq.com/s/-jVi5tOiedyKvffERAXxYA

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章