「旧」AI 已死，「新」AI 万岁

公众号新闻

2022-11-22 06:11

作者 | Bill Wadge

译者 | 平川

策划 | 刘燕

本文最初发布于 Bill Wadge 的个人博客。本文仅代表作者观点。

艺术的挥洒，就是你的容身之处。

—— Marshall McLuhan

[本文的所有图片都是用生成式 AI（Midjourney、DALL-E 2、Stable Diffusion）生成的。大部分是由 Paul DelSignore，而不是我]

毕加索风格的《蒙娜丽莎》

我曾在维多利亚大学教授人工智能课程——感谢上帝，我退休了。我已经无法跟上翻译、博弈，特别是生成式 AI 方面的突破。

我教 AI 的时候，还主要是 GOFAI（Good Old Fashioned AI）。2015 年我退休了，就在 GOFAI 的时代结束之前。我躲过了一劫。

我对 NFAI（New-Fangled AI）望而生畏，迄今为止我还不知道它的工作原理。但我确实很了解 GOFAI，在这篇文章中，我想分享下我敬畏 NFAI 而不敬畏 GOFAI 的原因。

找，就会找到

在很长一段时间里，在非人工智能计算机科学家眼里，人工智能几乎就是一个笑话。当时的宣传天花乱坠，但从未实现什么大的突破。人们常常讽刺说，人工智能实是天生的蠢蛋。

许多院系，包括我所在的院系，基本上都在抵制这门学科，又或者只是提供一门入门课程。

GOFAI 的核心是搜索——树，更一般地说，是图。几十年来，树搜索的基准是国际象棋。几代人工智能研究人员都遵循 Norbert Wiener 在 40 年代首次提出的程序，以搜索国际象棋博弈树为基础。每隔十年，人工智能的传道者就会做出承诺，只要再过 10 年计算机就可以掌握国际象棋。

Wiener 在其开创性著作《控制论》中描述了他的想法，即对博弈树进行最小 / 最大搜索，并在搜索太深入时，诉诸于启发式方法来评估位置。

国际象棋博弈树很快变得非常大，直到几十年后（20 世纪 90 年代末），IBM 才集结力量实现了 Wiener 的梦想。他们构建了一台专用机器“深蓝（Deep Blue）”，每秒能够检查 1 亿个位置。“深蓝”最终先赢一局，并在整场比赛中战胜了世界冠军 Gary Kasparov。

深蓝是 GOFAI 的巅峰之作，后续并没有什么实质性的发展。“深蓝”的后继者 Watson 在策划方面可能更胜一筹，但从未实现商业应用。

AlphaGo 和 AlphaZero

“深蓝”给我留下了深刻的印象，但我让我更为好奇的是围棋。围棋的棋盘是 19×19 的，其博弈树要比国际象棋大得多。如果你当时问我，我会说精通围棋是不可想象的（如果必须使用 GOFAI，那确实如此）。

然而，在 2016 年，不可思议的事情发生了：一个名为“AlphaGo”的程序开始击败围棋冠军。它没有采用 Wiener 的方法；相反，它使用了机器学习（ML）（不要问我它的工作原理）。

AlphaGo 通过与自己对弈数百万次进行训练。起初，人们给它输入了数十万场专家级的人类对局，但它的继任者 AlphaZero 放弃了这些对局，只是自学。只需要几个小时，它就能达到专家级水平，而人类花了几百年的时间。该软件的变体以类似的方式掌握了国际象棋、跳棋和日本象棋（shogi）。

谷歌翻译

大约在同一时间，谷歌翻译的用户注意到，其翻译质量突然间有了大幅提升，尽管谷歌当时什么也没说。事实上，谷歌已经从统计学转向了神经网络（不要提问）。

目前，谷歌翻译已经非常好（DeepL 的更好）。例如，在翻译成法语时，它通常能正确地处理代词并保持性别 / 数字的一致。如果你想要得到完美的输出，多少还是要做点校对，因为其中偶尔会有错误，虽然通常很小。

以下是对《法国世界报》的一段翻译，很完美：

Since the beginning of the conflict, Russia has refused to describe its invasion of Ukraine as a war, calling it a “special military operation”. Shortly after the conflict broke out, the authorities banned the Russian media from using any information other than official statements on the subject and banned the use of words such as “war” and “invasion”, under penalty of being punished by the law.

（自冲突开始以来，俄罗斯一直拒绝将其对乌克兰的入侵描述为战争，而称其为“特别军事行动”。冲突爆发后不久，当局禁止俄罗斯媒体使用官方声明以外的任何信息，并禁止使用“战争”和“入侵”等字眼，否则将依法处罚。）

GOFAI 从来没有真正生成过好的翻译，因为它依赖事实和规则。我记得全班同学都曾因为翻译错误而开怀大笑。有一次，在翻译一篇关于伊拉克的德语新闻时，它说萨达姆“warned the US before an attack（在发动攻击前警告过美国）”，而这句话的准确说法是“Saddam warned the US of an attack（萨达姆警告过美国要发动攻击）”。现代系统绝不会犯这么低级的错误。

生成语音

然后是 GPT 3 和其他生成语音的系统。起初，它们只是通过预测来补全不完整的句子。但现在，它们更进一步，可以写出整篇文章。（通常来说）这是有意义的。下面是一个例子。

作者输入：Write me an article about creativity please （请给我写一篇关于创造力的文章）

GPT-3 回复：I’ll be honest. I don’t know much about creativity. I’m not a psychologist and I’m not a creative myself. I’m just a guy who likes to read about psychology and creativity. What I can do, though, is write you an article about creativity that’s based on what I have read. That way you get a proper article, but you don’t have to pay for the expertise of a psychologist or a creative person.（实话实说，我不太了解创造力。我不是心理学家，我自己也不是一个有创造力的人。我只是喜欢阅读有关心理学和创造力的书籍。不过，我能做的是，根据我所读到的内容，为你写一篇关于创造力的文章。通过这种方式，你可以得到一篇像样的文章，不需要花钱请心理学家或有创造力的人。）

在这些方面，GOFAI 从未取得任何成就。但后来我的头脑完全被……

生成艺术品

后来 DALL-E 和 DALL-E 2 出现了。但直到 Stable Diffusion 发布，我才开始关注这个领域。当然还有骑在马背上的宇航员和戴墨镜的猫的照片。但真正打动我的是那些有着著名艺术家风格的画。以下是我最喜欢的两幅：