伟大的A.I.觉醒 (一)
伟大的A.I. 觉醒
Google如何使用人工智能来转换它最热门的服务Google翻译以及机器学习如何重塑计算本身
BY GIDEON LEWIS-KRAUS
纽约时报2016 12月14日
序言:你就是你的阅读
11月初的一个星期五晚上,东京大学人类计算机互动的著名教授Jun Rekimoto在准备一个演讲,当他开始注意到网上社交媒体上滚动的一些奇怪的帖子。 突然之间,谷歌翻译,谷歌热门的机器翻译服务,有了几乎不可思议的改进。 Rekimoto访问了谷歌翻译本身,开始实验。 他很震惊。 他必须去睡觉,但是谷歌翻译牢牢地抓住了他的想象力。
Rekimoto把他的初步发现写在了在一篇博客中。 首先,他用这个新的Google翻译能比较了从两个版本的“了不起的盖茨比”,Takashi Nozaki的1957年翻译和Haruki Murakami的新版本中的几个句子。 Murakami的翻译用了“相当精致的日语”,Rekimoto后来在电子邮件中向我解释,文风是独特的“村上风”。相比之下,谷歌的翻译 - 尽管有一些“小的不自然” – 给他的感觉“更清晰 “。
Rekimoto的后半部分博客从另一个方向检验了翻译服务,从日语到英语。 他匆匆翻译了海明威的“乞力马扎罗山的雪”的开篇,然后通过谷歌翻译成英语。 他把这个翻译和海明威的原作放在一起,然后邀请他的读者猜一猜哪一段是机器翻译的。
NO. 1:
Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.
NO. 2:
Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.
甚至对于以英语为母语的人来说,豹子没有介词是唯一露馅的地方,第2号是自动机的产物。对Rekimoto来说两者高度的一致性是一个奇迹,Rekimoto非常熟悉以前翻译服务的能力。 在24小时前,Google只能翻译相同的日语段落如下所示:
Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.
Rekimoto在Twitter上向他的十万多个关注者推送了他的发现,在接下来的几个小时,成千上万的人推送了他们自己在机器翻译服务上的实验。 有些是成功的,有些是为了搞笑。随着东京黎明破晓,谷歌翻译成了日本Twitter上排名第一的流行话题,甚至超过一些热追的动漫系列和一个女子超偶像乐团期待已久的新单曲。 每个人都想知道:Google翻译如何变得如此诡异地精准?
四天后,来自世界各地的几百名记者,企业家和广告客户聚集在Google的伦敦工程办公室等候一个特别公告的发布。 客人收到了谷歌翻译品牌的幸运签语饼。 里边的纸条一面是一个外语短语 -- 我的是挪威语 -- 另一面是邀请下载翻译应用程序。 桌子上放置了一盘盘的甜甜圈和冰沙,每个都有标签告诉你它的味道,德语(zitrone),葡萄牙语(baunilha)或西班牙语(manzana)。 过了一会儿,每个人都给带到了一个黑丝绒剧场。
伦敦市长Sadiq Khan站起来做开场白。 一个朋友最近告诉他说他让人想起谷歌。 “为什么,因为我知道所有的答案?”市长问。 “不,”朋友回答说,“因为你总是试着完成我的句子。”听众礼貌地点着头。 Khan接着介绍Google的首席执行官Sundar Pichai走上舞台。
Pichai是来伦敦分部为谷歌的新建筑,一个正在Kings Cross修建中的新“知识区”的基石奠基,另一方面是为了揭示他去年宣布的公司转型的初始阶段的完成。Pichai曾多次说过 Google的未来会是“A.I. 第一“。这意味着什么,从理论上来说很复杂,并且受到了很多猜测。 在实践中,如果运气好的话,很快公司的产品将不再代表传统计算机编程的果实,而是“机器学习”。
成立于五年前的Google Brain是公司内部的一个高冷部门,它基于这样一个原则:人工的“神经网络”通过试错来熟悉世界,就如幼儿做的,它可能会发展出类似人类的灵活性。这个概念不是新的 -- 它的一个版本可以追溯到20世纪40年代的现代计算的最早阶段 -- 但在它的大部分历史上,大多数计算机科学家认为它不靠谱,甚至是神秘的。自2011年以来,Google Brain已经证明这种人工智能的方向可以解决许多耗时几十年的用传统方法无力解决的问题。在Google Brain重新改造之前,语音识别做得并不好; 机器学习的应用使其在谷歌的移动平台Android上的性能变得几乎和人类记录一样好。图像识别也是如此。不到一年前,Brain第一次开始对整个产品进行内部改造,今天晚上是庆祝其巨大的成果的时候。
谷歌翻译在2006年首次亮相,从此成为Google最可靠和最热门的资产之一; 它每月为超过5亿的不同语言的用户提供每天140亿字的服务。 它不仅是一个独立的应用程序,而且是Gmail,Chrome和许多其他Google产品不可分割的功能,我们把它作为一个按钮,一个我们的数字商务无摩擦,自然的一部分。 只有在难民危机中,Pichai在讲台上解释说,公司才意识到谷歌翻译的地缘政治重要性:在他身后的屏幕上出现了一个曲线图,其陡峭的曲线表明阿拉伯语和德语之间的翻译最近增加了五倍。 (它也在Pichai的心里占很重地位,他在印度长大,一个有几十种语言的地方。)翻译团队一直在稳步增加新的语言和功能,但在过去四年里质量的提高已经大大减慢了。
直到今天。 截至上个周末,谷歌翻译的大部分流量已经转换为基于AI的系统,不仅在美国,而且在欧洲和亚洲:推出了包括英语和西班牙,法语,葡萄牙语,德语,中文,日语,韩语和土耳其语之间的翻译。 其他一百多种语言的翻译也快了,目标是到明年年底每月8个。这个让谷歌自己的工程师也倍感惊喜的新版本只花了九个月就完成了。 A.I. 系统已证明过这一夜之间的改善大致相当于老版本在其整个生命周期内的累积。
Pichai热衷于晦涩的文学隐喻; 一个月前在加利福尼亚州山景城的办公室他告诉我,翻译存在的部分原因是因为不是每个人都可以像物理学家罗伯特·奥本海默通过学会梵语读原文的Bhagavad Gita。 在伦敦,在他身后的监视器上的幻灯片闪出Borges的话:“Uno no es lo que es por lo que es,sino por lo que haleído。Pichai笑着朗读一个由旧的翻译系统翻的笨拙的英语版本:“One is not what is for what he writes, but for what he has read.” (一个不是他写的东西,而是你读到的东西),右边是一个新的A.I.版本:“You are not what you write, but what you have read.” (你不是你写的,而是你读的)。这是个贴切的评语:在某种意义上,新的Google翻译运行在第一台学会了读任何东西的机器上。
在工业界机器学习的狂想中,Google决定围绕A.I.重组自己的决定是第一个重要的宣言。在过去的四年中,尤其是谷歌,Facebook,苹果,亚马逊,微软和中国百度等六家公司已经开始了A.I.的军备竞赛。人才,特别是在大学内。企业对资源和自由的承诺稀释了顶尖的学术院系。在硅谷,众所周知Facebook的首席执行官马克·扎克伯格(Mark Zuckerberg)亲自通过电话和视频来延揽最受欢迎的研究生。七位数的起薪时有所闻。参加该领域最重要的学术会议的人数增加了近四倍。重要的不仅仅是一个零碎的创新,而是控制一个可能代表全新的计算平台:无处不在的人工智能。
“人工智能” 这个字眼说起来好像它的含义是不言而喻的,但它一直是混乱和争议的根源。 想象一下,如果你回到了20世纪70年代,拦住街上的一个人,拿出一部智能手机,对她展示谷歌地图。 一旦你设法说服她你不是一个着装奇怪的巫师,从你的口袋里拿出的不是一个黑巫术的护身符,而只是一个比担任阿波罗任务的计算机更强大的小小计算机,对她而言,谷歌地图似乎当然是一个很有说服力的“人工智能”的例子。在一个非常真实的意义上,它就是。 它可以做任何识地图的人可以做的事,像让你从你的酒店到机场 –- 可是它可以做得更快更可靠。 它也可以做人类显然不能做的事情:在你下错出口时,它可以评估交通,计划最好的路线,重新定位自己。
实际上,今天没有人会给Google地图尊贵的“AI”称号,就如我们极少带感情地使用“智能”这个词一样。我们认为人工智能必须是区分HAL(2001太空漂流记中的人工智能机器)和其它任何织机或手推车可以做的。 一旦我们可以自动完成一项任务,我们将涉及的相关技能降级为单纯的功能之一。从贬义上说今天谷歌地图似乎就是机械的:它只接受一个明确的指令(从一个地方到另一个地方),并尽可能有效地满足这个指令。 “人工智能”的球门因此不断退后。
当他有机会时,Pichai仔细区分了目前的A.I. 应用以及“通用人工智能”的终极目标。通用人工智能不会忠实地遵守明确的指令,而是将展示一种具有隐含的,解释性的功能。它将是一个通用工具,为一般情况下的一般用途而设计。 Pichai认为他的公司的未来取决于此。想象一下,如果你能告诉谷歌地图,“我想去机场,但我需要停下来,为我的侄子买一个礼物。”一个更通用的智能版本的服务 -- 无处不在的助手,就像斯嘉丽·约翰逊在三年前在斯派克·乔恩的电影“她”中令人难忘地演绎的一样,- - 会知道好多事情,比如一个亲密的朋友或勤恳的实习生所可能知道:你的侄子的年龄,你通常喜欢花多少钱在孩子的礼物,和在哪里找到一个开门的商店。但一个真正聪明的地图也可以知道一个亲密的朋友不知道的,如你侄子学校的学龄前儿童中最近刚火起来的东西,或更重要的是,什么是用户实际想要的。如果一个聪明的机器能够辨别关于我们过去行为的一些错综复杂的数据或含混的规律,它也许能够推断我们随后的欲望,即使我们自己对此也一无所知。
A.I.辅助助理应用的新浪潮-- 苹果的Siri,Facebook的M,亚马逊的回声 - 都是机器学习的产物,具有相似的意图。 然而,机器学习的企业梦想并没有被透视消费者的目标所耗尽。 三星的医学成像子公司今年宣布,其新的超声设备可以检测乳腺癌。 管理顾问正在全力以赴给高管们准备自我编程计算机越来越广的工业应用。 DeepMind是2014年谷歌的一项收购,它击败了古老的围棋游戏的人类大师,尽管预测说这样的成就还需要10年。
艾伦图灵在著名的1950年的论文中提出了一个通用人工智能的测试:一个计算机可以在五分钟的文本交换的过程中,成功欺骗一个真正的人类对话者。 一旦机器可以在两种自然语言之间流畅地翻译,有一天一台机器可能足够好地 “理解”人类语言并进行可能的对话的根基已经被建立了。 Google Brain的成员,推动和帮助监督翻译项目,相信这样一个将成为个人数字助理的通用全智能机器已经上路了。
接下来的是一个谷歌研究人员和工程师团队如何在这个方向从一两个人,三四个人,最后超过一百多个人取得了巨大进步的故事。在很多方面这是一个不寻常的故事,不光是因为它打破了我们已经习惯的许多对硅谷的刻板印象。 它没有推出任何认为明天或第二天一切都将无法辨认的人物,因为他们是一些在车库里异想天开的匠人。 它不是一个关于人们认为技术将解决我们所有的问题的故事,也不是一个关于人们认为技术会不可避免地创造毁灭的故事。 这与破坏无关,至少不是以这个词常用的意思。
事实上,这是三个重叠的故事,关于Google翻译的成功变形到A.I. -- 一个技术故事,一个体制故事和一个关于创意演化的故事。技术故事是关于一个公司的一个产品团队,以及他们只用了大约四分之一的时间改进,测试和引入一个全新版本改造旧产品的过程,超过任何人,包括他们自己的预期。体制故事是关于该公司内一个小而有影响力的人工智能团体的员工,以及他们的流程中对一些关于计算的旧的,未经证实概念的直觉信念如何颠覆了附近其他公司。创意的故事是关于长期以来一直默默无闻的认知科学家,心理学家和不懈的工程师,以及他们看似不理性的信念最终激发了我们在技术,理论,甚至意识本身的范式转变。
第一个故事,谷歌翻译的故事,发生在山景城九个月的时间里,它解释了机器翻译的转型。 第二个故事是Google Brain及其众多竞争对手的故事,发生在硅谷五年的时间里,它解释了整个社区的转型。 第三个故事,深度学习的故事,发生在各个遥远的实验室里- - 苏格兰,瑞士,日本和加拿大的大部分地区- – 在七十多年时间里,它极可能帮助修订了人作为首先和最重要的会思考的存在的自我形象。
这三个都是关于人工智能的故事。 七十年的故事是关于我们可能会想到的或者想要的。 五年的故事是关于它在不久的将来可能做什么。 这个九个月的故事是关于这一分钟它可以做什么。 这三个故事本身只是概念的证明。 所有这一切只是开始。
-------------------------------------------
译后记:
这是年前读到的关于人工智能最有深度的文章。读完之后立马用谷歌翻译把2700多字序言翻译出来,连带修改用了三个小时。不竟对这个新AI版的翻译器非常叹服!感觉真的是奇点在临近,从5年到9个月,革命已经发生,不难想见新的学习模式,传播模式都会随着降临。借狄更斯的话,“那是最好的時代,也是最壞的時代;是智慧的時代,也是愚蠢的時代;是信仰的時代,也是懷疑的時代;是光明的季節,也是黑暗的季節;是充滿希望的春天,也是令人絕望的冬天;我們的前途擁有一切,我們的前途一無所有;我們正走向天堂,我們也走向地獄。”