百度AI背后,藏着一群女性科学家
在浩瀚的技术海洋中,这些女性独有的力量正在不断流转,将科技的边界拓展得更宽。
文 | 修七七
编辑 | 金匝
运营 | 绘萤
吴华女士比想象中“科技大佬”的形象要更轻盈。
她是百度技术委员会的主席、百度人工智能背后的科学家,讲起话来声音轻快,每一句话的末尾语调都会上扬,极有感染力。这种对人工智能的热情,能通过她的声音,很快传达到听众身上。
1月10日,一年一度的Create百度AI开发者大会上,吴华向观众们展示了百度人工智能最具创作力的一面,也是AIGC(利用AI技术自动生成内容的生产方式)相关的成果:她和团队,在百度创造了一个“会搞创作”的系统。
这就是百度的文心大模型,也是一群能力超群的天才创作者——有“天才编剧”文心ERNIE 3.0 Zeus、“美术师、插画师”文心ERNIE-ViLG 2.0,以及“剪辑师和动画师”视频内容生成与编辑技术。在这个系统中,创作者只需要输入一个题目,它就可以瞬间结合语境,写出上百篇不同体裁、风格的作品,甚至是完成一个剧本,拍摄一部电影。
它也可以根据一句话,或者一段描述,生成写实、意象、中国风、二次元等不同风格的精美画作,可以生成现实世界中没有的创造性的图像,比如穿西装的齐天大圣、街边撸串儿的熊猫……让人们天马行空的想象力得到精准的可视化呈现。
“如果你掌握了这项内容创作能力,那你几乎可以完成一部影片的许多重要工作,成为“天才创作者”。再配上自己设计的虚拟人演员,那你就可以成为一个真正的‘独立’制作人、真正的‘独立导演’。”但这项技术背后,每一次人工智能的创作,都需要吴华这样的百度科学家们以及她所带领的团队,在背后一点点设计算法并付诸实现,模仿出人的创作。
在人工智能领域,吴华算是最早的一批探索者。她最早接触计算机科学是在1998年。那时,她报考了中国科学院自动化所的博士。做这个决定,是因为她觉得自己的抽象思维不错,而计算机行业正热。
那也是一个具有标志性意义的时代,千禧年即将到来,人工智能已经在增长——就在吴华报考的前一年,由IBM开发的国际象棋电脑Deep Blue,击败了卫冕世界冠军,成为第一个赢得国际象棋比赛的系统。那时的吴华并不了解人工智能,作为中科院那场选拔性考试的第一名,她的命运看似充满偶然,她后来的博士导师向她发出了邀请:“这么好的成绩,来读模式识别吧。”
用现在的眼光来看,当时中科院自动化所的模式识别实验室,就是中国人工智能实验室。吴华在这里研究自然语言处理,这里还有语音识别、计算机视觉,以及机器人等,也在那个拓荒的年代打下了坚实的人工智能算法基础。
如今,算法、算力与数据,已经成为了人工智能的三驾马车,吴华也一直站在这个学科的最前沿。伴随着她和同事们的研究,人工智能在中国拓荒、爬坡、崛起,快速爆发,最终成为互联网公司进击的刀锋。但一开始,吴华面对的困境,是难以想象的。
在人工智能领域,机器翻译,算得上是最典型的应用。起初,机器还不能理解语义,无法做到上下文相关的理解,翻译也是啼笑皆非。比如,当你在翻译器里输入“how old are you”,时常会被译为“怎么老是你”,再输入“fall into the water carefully”,则有可能得到“比较小心地落入水中”这样令人发笑的结果。
事实上,这样的翻译结果,现在也依然能在一些景区看到。要解决这个问题,就得让机器变得更“聪明”,能自动识别不同的语义和场景,提高准确率。作为研究深度学习和自然语言处理的最早一批研究者,2010年2月,吴华承担了打造百度翻译的重任。
那时,吴华的团队仅有几个人,工作量大,加班自然是常态,但每个人都像打了鸡血一般,最终成功上线。但给吴华留下最深印象的,不是这些工作上的艰辛,而是另一个巨大的困扰。
在2014年,新生的神经网络翻译(一种深度学习技术),能克服统计机器翻译将句子分割为不同片段进行翻译的缺点,充分利用上下文信息,进行编码和解码,从而产生更为流畅的译文。但在当时,学术上还没有完全证明它相对统计机器翻译的优越性。
吴华看到了深度学习的潜力,决定把神经网络翻译做到产品中,在产品中验证可行性,这在当时看来是一个非常大胆的决定。除了效果没有被验证,还有一个问题就是,新的深度学习技术太消耗算力了,吴华每天要面临的,都是来自自己的拷问:“你要怎么把这个模型做出来?如何解决这么大的算力问题?即便把模型做了出来,应用在手机等设备上,你要怎么把这个模型再做小?”这是她必须越过的几座大山。
最终,吴华和她的团队一一破解,同时在云端和手机端上部署, “当时是旗帜性的进步”。 百度在2015年5月,率先发布了在线神经网络机器翻译系统。一年多之后的2016年9月,Google具备深度学习功能的翻译器才发布。
百度翻译获得了多项殊荣,包括国家科学技术进步奖二等奖、北京市科技进步一等奖等。《纽约时报》等媒体,也都称赞这一工作是“开创性的”。
神经网络机器翻译成功后,背后的技术原理被广泛地应用在人工智能领域。而吴华和团队所开创的技术,从来都不会只搭载一个应用。对百度来说,翻译也是如此,只是人工智能布局中的一步。
吴华具有良好的技术敏锐度,带领团队在大模型、语义理解、对话、问答等技术上取得了多项世界领先的成果,服务了百度几乎所有的产品线。
如果把人工智能比作一栋房子,吴华和百度的工作就是不断地、持续地打地基。基打得越深、越牢靠,上面的房子就能盖得更高、更漂亮。深度学习与自然语言处理技术,再往下精进,便进入了大模型的深水区,她要带领百度的人工智能,走向语义理解和创作齐头并进的新阶段。这个阶段,在她看来,“对技术和应用的趋势预判”尤为重要。“是面向用户的应用,要解决不同用户的需求,但是技术的底层逻辑都相通。”吴华说。
吴华享受将不可能变为可能的快乐瞬间,更享受团队里大家对技术的向心力,在这里,大家对技术的迷恋很纯粹。吴华珍视技术带给自己充沛而又饱满的生命体验,也察觉到入行25年以来,整个行业已经越跑越快。“原来领先一年半,就是很好的领先。百度翻译把神经网络翻译方法上线之前,行业多年没有大的技术精进了。”但现在,后来者越来越多,所有人都往前拼命跑,“领先半年,都是巨大的困难”。
这也没有什么更好的解决方案,“无非就是找准方向拼命往前跑,做梦的时候也想想方法,醒了就可能出现灵感”,她最在意的,始终是“我是不是在技术的最前沿”,以及“技术是否真正服务用户和客户”。
每天早晨7点,吴华都会准时踏入百度科技园,在空荡荡的办公室里,她会独处三小时,来思考技术的难题。临近10点,同事们才会渐渐把工位填满,带着自己的思考,她和同事们开始一轮又一轮的技术讨论,一步又一步的向外拓展人工智能的边界。
AIGC在2022年的迅速火爆,进一步引燃了大众对人工智能的热情。而除了人工智能的进步,量子计算等前沿技术对大众也越来越不陌生。本次Create大会上,百度再次展现了量子领域的布局,以及致力于推进中国的量子产业化的信心。
在北京城区的东南角,亦庄百度量子实验室里,一台百度量子计算机“乾始”,昼夜不停地嗡嗡运转。进入这个实验室前要穿上防尘服和鞋套,戴上降噪耳机,人跟人之间的交流,要靠耳机才能听得更清楚。年轻的百度量子计算研究所高级研究员陈澄博士,已经在这里工作了一年半,这些噪音,某种程度上,已经成了让她觉得安心的“陪伴”。
声音是制冷设备发出的。白色的圆柱形筒里,还包裹了好几层,用于给最底层方寸之间的小芯片提供低于零下273.14摄氏度的极低温度,这是超导量子芯片最喜欢的温度。“这个小小的芯片就是量子计算机的心脏。”陈澄说,“越冷静的状态下,它算得就越快,这是宇宙中最寒冷的地方,超导效应在此产生。”
量子计算机的计算力快得惊人,如果要对一个300位的大数进行质因数的分解,哪怕是全世界最顶级的传统计算机,也需要10万年以上才能计算出来。但在这里,仅需1秒钟,便能得到解决——这就是量子计算机的威力。
为了搭建这样一台量子计算机,百度花费了巨大的成本与精力。团队都是从全球最顶尖的高校科研院所招揽来的精英。陈澄是北京大学物理的博士,在北大读博的时候就主攻超导实验研究。在实验室时,陈澄通过显微镜观察微观尺度下的一个个原子排布,以及它们之间的相互关联,不禁惊叹于自然的神奇与奥秘。同时,她也对超导材料的实际应用产生好奇,想知道量子技术对我们的生活会产生怎样的改变和影响。
她想将自己的研究在产业内落地,但这个时期还有些早,量子的产业化落地,暂时还具备一定的困难和挑战,需要脚踏实地一步一步地走,但陈澄心里知道,它就像一座灯塔,一定是未来发展的方向。
在此之前,传统计算已经统治了70多年的时间,人们也开始迎来了数字化时代的爆发,大家在网络上信息往来、完成交易、沉淀数据,维持信息化时代衣食住行的运转。时不时的“宕机”开始成为某种时代症候,传统计算机不堪重负。陈澄觉得,或许量子计算即将迎来发展的关键临界点。
我们现在使用的手机、电脑、平板等,最底层的芯片都是由半导体晶体管组成的电路。在逻辑上,这种半导体晶体管组成的电路将逐渐逼近极限,如果没有新的技术替代,到2040年,计算机的耗能将可能超过总发电量——这太恐怖了。
但量子计算不一样,这是一种全新的计算范式,它带来的不是倍数算力的提升,而是指数级的提升,能对经典应用场景起到加速的作用,极大丰富量子产业化的应用场景,比如对人工智能、金融科技、新能源以及医药化工等多个重要领域带来革命性的推动作用。
陈澄想把自己对这个行业的前瞻性研究落地,但进行量子研究的产业化平台并不多,得知百度要建一个量子实验室,这与陈澄想要进一步了解超导量子计算行业的初衷不谋而合。而这里,几乎代表了最先进计算力的触探。
量子实验室建设期间,陈澄每天往返于海淀与亦庄之间,亲眼见证百度超导量子计算机“乾始”硬件平台的搭建,一开始只是一个设想,接着是一层又一层的“金钟罩”的加固,直到今年8月,那个白色的大罩子也套上了。实验室挂牌那天,陈澄非常难忘,她和团队的努力正在一步步实现。
2022年8月25日,那台搭载着量子芯片,连接着软件和应用的“乾始”正式发布。一起推出的,还有全球首个全平台量子软硬一体化解决方案“量羲”,可以为企业提供一站式产业化量子升级服务。陈澄介绍,在任何地方都可以便捷地使用“量易伏”App,与远在亦庄的百度量子计算机相连。每一个量子爱好者在手机上就可以访问“量子作曲家”模块,选择在量子模拟器或真实量子计算机上,“跑”一个自己的量子电路,亲身感受量子计算的魅力,成为那个世界上计算最快的“人”之一。
不同于以往的量子计算机,“乾始”是一台集“应用、软件、硬件”三位一体的高度集成的产业级超导量子计算机。这意味着“乾始”不再是一个“裸机”,而是可以“开箱即用”。
“乾始”的出现,让量子算力走出实验室走向产业化,变得触手可及,也标志着中国在量子计算产业化道理上进入全球第一梯队。
在这样一个实验室里,陈澄正将自己的设想转变为现实。从小,她就是个动手性极强的孩子,脑子里充满各种奇奇怪怪的问号,她想探求物质世界的本质,尽管在传统观念里,这条路径上的女性鲜少,但她觉得,“只要遵循自己的兴趣和爱好,去选择自己喜欢或擅长的领域,与性别无关,都能实现自己的价值。女性同样也可以通过自己的知识技术,用细腻和敏锐的视角在前沿科学领域,甚至是社会各个领域中贡献自己的力量。”
量子计算已经不再遥不可及。如果把陈澄和百度量子的工作比作先点亮的一盏灯,围绕着它,将吸引千千万万、志同道合的伙伴一起,共同为中国量子计算产业化和量子计算生态的努力,力争实现“人人皆可量子”的美好愿景。
对技术的信仰和追求,也从百度内部延伸到更广阔的地方。百度长期以来重视技术人才的挖掘与培养,通过设立奖学金的方式来加速国内AI人才建设体系。在2022年百度奖学金的评选中,来自清华、上交大、中科大、麻省理工等国内外顶尖高校的10位学生脱颖而出,他们的研究领域,覆盖智慧医疗、自然语言处理、计算机视觉等多领域。而这一届百度奖学金的获得者洪逸宁,也是人工智能领域的女性新生力量。
技术道路上的好奇和探索,往往来自于一个浪漫的想法。儿时,洪逸宁有50多个芭比娃娃,每一个长得都不一样,它们有各式各样的衣裳。她喜欢给它们换衣裳,穿上,脱下,再穿上——娃娃是她童年最好的玩伴。
那时的洪逸宁总会想象,在一个平行时空里,这些芭比娃娃会有自己的性格、爱好,喜欢的食物,能跟自己对话、玩闹。只是现在,它们都不够聪明,读不懂她的心事,听不懂她弹得钢琴,暂时还没办法跟她交流。
再长大一些后,她发现,她会在和人对话时突然神游天外,开始“翻译”自己脑子里里天马行空的幻想。她突然有了一个想法,想把脑子里的这个“小宇宙”造出来,创造一个AI形象,日夜陪伴着自己,她想着,随着时间的相处与磨合,它也会越来越懂自己,成为自己最好的玩伴。
这个想象太大胆了。她在两部美剧里看到过女黑客,手指轻点,便能进入另一个世界,“超帅!”。在高考志愿表上,她填下上海交通大学工科实验班,本科毕业后,又去加利福尼亚大学洛杉矶分校攻读计算机硕士,一年后顺利转为博士学位的攻读。
她每天泡在电脑前,一遍又一遍地构想她的3D物理世界。在那个世界里,她创造出来的AI“小人儿”看到一幅画上的浪花,可以想象到大海,看到一盘食物,可以想象出味道,这些都要通过打开AI人物的五官与大脑,用眼睛看,用鼻子闻,用大脑进行推理与判断,从而做出最符合逻辑的反应。
在计算机领域里,这也是2D图像超越模式识别,能够在3D空间中进行常识性推理与反应的重要命题。在这个领域,IBM美国研究院首席科学家淦创、计算机视觉专家朱松纯教授和吴英年,都在孜孜以求地探索,一寸一寸地往前触探,他们也都是洪逸宁的领路人。
但这条路的起点,并不顺畅。等真正学了计算机,洪逸宁才发觉,那些繁复的编程,她很难提不起兴趣,艰涩的代码真正上手做起来,也没有美剧里的黑客那么轻巧,“怎么学都学不会,就去死记硬背,但完全行不通”。成日泡在琴房弹钢琴成了洪逸宁的日常,一弹就是半夜,直到第二学年,闯进智能物联网专家王新兵教授的实验室,参与到数据可视化的工作,洪逸宁才突然发现,“计算机原来也可以这么具备美感”。
那份工作是,在某个领域找到许多作者的论文,找出不同论文之间的联系,然后用地图的形式将这些论文实现可视化。当自己第一次改出代码运行出来,洪逸宁惊叹道:“我画出的地图就像一个星空,里边有很多星星,那些教授和作者遍布其中,我越去构建代码,这个地图就越具备美感。”
之后的日子里,她就变得主动多了。她负责运营学院的一个学术型公众号,通过这个公众号,要给读者传递某一领域最前沿的学术信息,每一篇文章的诞生,都要看上千篇论文,“至少耗费两三个星期,太烦了”。这个古灵精怪的姑娘跟实验室同伴说:“要是AI能帮我们阅读这些论文就好了。”
就这样,几个小伙伴花费了半年,研究出一个自动读论文的模型,这个模型可以迅速阅读论文,获得出论文的主要观点、使用的主要研究方法。后来,她写一篇公众号文章的时间只需要一天,这个模型在同学中流传,成为大家速读论文的“利器”。那是她第一次感觉到,自己的创造竟然能给身边人带来这么实际的便利。
洪逸宁把这套模型的研究方法写成论文发表,紧接着,便收到了夏威夷一场学术会议的邀约。在夏威夷,有人来看她的论文展板,也跟她交流学术,她开心极了。最要紧的是,会上那些侃侃而谈的教授们,“都在做着我看不懂的工作”。在洪逸宁眼里,“她们是发着光的”。“我就想,她们也是从本科生一步一步长成今天这个样子的,我也想长成那样。”临近毕业,洪逸宁决定:“我要去国外读博,我要过去看一看。”
在UCLA,洪逸宁离造出那个理想中的AI“小人儿”更近了。她把这个“小人儿”的小宇宙进一步分解,就像一个每天都在感知图案、语⾔、声⾳的婴儿,它能慢慢长大,认知3D世界,和人交流合作,观察和体验不同物体的⽤途,慢慢叠加成知识、常识和记忆,叠加成区别于他人的内在模型。再⻓⼤⼀些,它要开始学会利⽤这些内在模型进⾏推理。
目前,AI技术发展飞速,已经可以识别出物体,并且描述出来,但没有完全形成常识和记忆,很难解释它们看到的事情,也很难与这个3D的真实世界进行互动,更难进行推理。洪逸宁想让AI拥有这些功能,尽情地探索这个世界。
但落地实现上,洪逸宁经常感到“痛苦”。她看到一本心理学书籍的封面上画了一个水桶,就想到:“如果这个水桶没有办法倒出水怎么办?”那么,可以设计一个AI修理工进入房间去修理它。当这个AI修理工进入房间提水桶时,它手的位置要主动选择在哪里,使用多大的力,水桶可以提起来,水的流动又会让水桶的轴产生多大角度的旋转,修理工会如何控制,甚至于水桶倾斜到哪个角度,水又会洒出来……这些都是洪逸宁要考虑的问题。这要涉及物理学、数学,甚至是心理学的内容,每一层技能的叠加,都是难度再上一个台阶,她要一遍又一遍地去调换参数去模拟试错,做到最难受的时候,甚至成宿成宿地睡不着觉,“觉得整个世界都崩塌了”。
她甚至会在夜里两点,在知乎上去检索:“什么样的人适合读博。”翻到了最后,内心的小宇宙跑了出来,“不读下去会后悔”,于是,再回过头继续去做。这样的焦虑,每一年都会跑出来两三次。
直到最近,这个研究终于有了新进展,这个AI修理工不仅会提水桶了,它还能推断物体的远近与大小,这一学术成果最近发表在了《CVPR2022》上。在现实生活里,这套技术可以在许多场景应用,比如做人类的AI助理,陪伴并帮助他们下判断,也可以给盲人做AI引导,帮他们规划、识别最优的路径,并带他们过去。“心里的大石头终于落了地”,而随着石头落地成形的,还有洪逸宁理想中的那个AI“小人儿”。
吴华、陈澄、洪逸宁,她们处于人生和科研的不同阶段,但同样对技术有着坚持和信仰,获得了百度最广阔的支持。她们的事业,与百度对技术的探索深深交织在一起,而百度对技术的探索精神,也通过她们不断流转蔓延,成为一种信仰和方向。在百度浩瀚的技术海洋中,这些女性独有的细腻、敏感的力量,也会将科技的边界拓展得更宽。
如今,在探索技术的星辰大海上,“她力量”正在绽放着璀璨的光芒。而这种光芒,也正闪耀在每一个穿梭在百度办公园区的女性身上。
今年的百度Create大会上,像吴华、陈澄一样的科技大咖们,也分享了百度在人工智能、量子计算这些领域的进展与思考。这是一场技术盛宴,也是有志者们的同行。而更多的技术信仰者,也会在未来与百度同行,一起去探索技术的星辰大海。
文章为每日人物原创
侵权必究
微信扫码关注该文公众号作者