百度AI背后，藏着一群女性科学家

其他

2023-01-15 03:01

在浩瀚的技术海洋中，这些女性独有的力量正在不断流转，将科技的边界拓展得更宽。

文 | 修七七

编辑 | 金匝

运营 | 绘萤

刀锋

吴华女士比想象中“科技大佬”的形象要更轻盈。

她是百度技术委员会的主席、百度人工智能背后的科学家，讲起话来声音轻快，每一句话的末尾语调都会上扬，极有感染力。这种对人工智能的热情，能通过她的声音，很快传达到听众身上。

1月10日，一年一度的Create百度AI开发者大会上，吴华向观众们展示了百度人工智能最具创作力的一面，也是AIGC（利用AI技术自动生成内容的生产方式）相关的成果：她和团队，在百度创造了一个“会搞创作”的系统。

▲ 吴华在Create大会上进行演讲分享。图 / 受访者提供

这就是百度的文心大模型，也是一群能力超群的天才创作者——有“天才编剧”文心ERNIE 3.0 Zeus、“美术师、插画师”文心ERNIE-ViLG 2.0，以及“剪辑师和动画师”视频内容生成与编辑技术。在这个系统中，创作者只需要输入一个题目，它就可以瞬间结合语境，写出上百篇不同体裁、风格的作品，甚至是完成一个剧本，拍摄一部电影。

它也可以根据一句话，或者一段描述，生成写实、意象、中国风、二次元等不同风格的精美画作，可以生成现实世界中没有的创造性的图像，比如穿西装的齐天大圣、街边撸串儿的熊猫……让人们天马行空的想象力得到精准的可视化呈现。

“如果你掌握了这项内容创作能力，那你几乎可以完成一部影片的许多重要工作，成为“天才创作者”。再配上自己设计的虚拟人演员，那你就可以成为一个真正的‘独立’制作人、真正的‘独立导演’。”但这项技术背后，每一次人工智能的创作，都需要吴华这样的百度科学家们以及她所带领的团队，在背后一点点设计算法并付诸实现，模仿出人的创作。

在人工智能领域，吴华算是最早的一批探索者。她最早接触计算机科学是在1998年。那时，她报考了中国科学院自动化所的博士。做这个决定，是因为她觉得自己的抽象思维不错，而计算机行业正热。

那也是一个具有标志性意义的时代，千禧年即将到来，人工智能已经在增长——就在吴华报考的前一年，由IBM开发的国际象棋电脑Deep Blue，击败了卫冕世界冠军，成为第一个赢得国际象棋比赛的系统。那时的吴华并不了解人工智能，作为中科院那场选拔性考试的第一名，她的命运看似充满偶然，她后来的博士导师向她发出了邀请：“这么好的成绩，来读模式识别吧。”

用现在的眼光来看，当时中科院自动化所的模式识别实验室，就是中国人工智能实验室。吴华在这里研究自然语言处理，这里还有语音识别、计算机视觉，以及机器人等，也在那个拓荒的年代打下了坚实的人工智能算法基础。

如今，算法、算力与数据，已经成为了人工智能的三驾马车，吴华也一直站在这个学科的最前沿。伴随着她和同事们的研究，人工智能在中国拓荒、爬坡、崛起，快速爆发，最终成为互联网公司进击的刀锋。但一开始，吴华面对的困境，是难以想象的。

在人工智能领域，机器翻译，算得上是最典型的应用。起初，机器还不能理解语义，无法做到上下文相关的理解，翻译也是啼笑皆非。比如，当你在翻译器里输入“how old are you”，时常会被译为“怎么老是你”，再输入“fall into the water carefully”，则有可能得到“比较小心地落入水中”这样令人发笑的结果。

事实上，这样的翻译结果，现在也依然能在一些景区看到。要解决这个问题，就得让机器变得更“聪明”，能自动识别不同的语义和场景，提高准确率。作为研究深度学习和自然语言处理的最早一批研究者，2010年2月，吴华承担了打造百度翻译的重任。

那时，吴华的团队仅有几个人，工作量大，加班自然是常态，但每个人都像打了鸡血一般，最终成功上线。但给吴华留下最深印象的，不是这些工作上的艰辛，而是另一个巨大的困扰。

在2014年，新生的神经网络翻译（一种深度学习技术），能克服统计机器翻译将句子分割为不同片段进行翻译的缺点，充分利用上下文信息，进行编码和解码，从而产生更为流畅的译文。但在当时，学术上还没有完全证明它相对统计机器翻译的优越性。

吴华看到了深度学习的潜力，决定把神经网络翻译做到产品中，在产品中验证可行性，这在当时看来是一个非常大胆的决定。除了效果没有被验证，还有一个问题就是，新的深度学习技术太消耗算力了，吴华每天要面临的，都是来自自己的拷问：“你要怎么把这个模型做出来？如何解决这么大的算力问题？即便把模型做了出来，应用在手机等设备上，你要怎么把这个模型再做小？”这是她必须越过的几座大山。

最终，吴华和她的团队一一破解，同时在云端和手机端上部署， “当时是旗帜性的进步”。百度在2015年5月，率先发布了在线神经网络机器翻译系统。一年多之后的2016年9月，Google具备深度学习功能的翻译器才发布。

百度翻译获得了多项殊荣，包括国家科学技术进步奖二等奖、北京市科技进步一等奖等。《纽约时报》等媒体，也都称赞这一工作是“开创性的”。

▲ 在百度希壤元宇宙中呈现的百度Create大会。图 / 受访者提供

神经网络机器翻译成功后，背后的技术原理被广泛地应用在人工智能领域。而吴华和团队所开创的技术，从来都不会只搭载一个应用。对百度来说，翻译也是如此，只是人工智能布局中的一步。

吴华具有良好的技术敏锐度，带领团队在大模型、语义理解、对话、问答等技术上取得了多项世界领先的成果，服务了百度几乎所有的产品线。

如果把人工智能比作一栋房子，吴华和百度的工作就是不断地、持续地打地基。基打得越深、越牢靠，上面的房子就能盖得更高、更漂亮。深度学习与自然语言处理技术，再往下精进，便进入了大模型的深水区，她要带领百度的人工智能，走向语义理解和创作齐头并进的新阶段。这个阶段，在她看来，“对技术和应用的趋势预判”尤为重要。“是面向用户的应用，要解决不同用户的需求，但是技术的底层逻辑都相通。”吴华说。

吴华享受将不可能变为可能的快乐瞬间，更享受团队里大家对技术的向心力，在这里，大家对技术的迷恋很纯粹。吴华珍视技术带给自己充沛而又饱满的生命体验，也察觉到入行25年以来，整个行业已经越跑越快。“原来领先一年半，就是很好的领先。百度翻译把神经网络翻译方法上线之前，行业多年没有大的技术精进了。”但现在，后来者越来越多，所有人都往前拼命跑，“领先半年，都是巨大的困难”。

这也没有什么更好的解决方案，“无非就是找准方向拼命往前跑，做梦的时候也想想方法，醒了就可能出现灵感”，她最在意的，始终是“我是不是在技术的最前沿”，以及“技术是否真正服务用户和客户”。

每天早晨7点，吴华都会准时踏入百度科技园，在空荡荡的办公室里，她会独处三小时，来思考技术的难题。临近10点，同事们才会渐渐把工位填满，带着自己的思考，她和同事们开始一轮又一轮的技术讨论，一步又一步的向外拓展人工智能的边界。

灯塔

AIGC在2022年的迅速火爆，进一步引燃了大众对人工智能的热情。而除了人工智能的进步，量子计算等前沿技术对大众也越来越不陌生。本次Create大会上，百度再次展现了量子领域的布局，以及致力于推进中国的量子产业化的信心。

在北京城区的东南角，亦庄百度量子实验室里，一台百度量子计算机“乾始”，昼夜不停地嗡嗡运转。进入这个实验室前要穿上防尘服和鞋套，戴上降噪耳机，人跟人之间的交流，要靠耳机才能听得更清楚。年轻的百度量子计算研究所高级研究员陈澄博士，已经在这里工作了一年半，这些噪音，某种程度上，已经成了让她觉得安心的“陪伴”。

声音是制冷设备发出的。白色的圆柱形筒里，还包裹了好几层，用于给最底层方寸之间的小芯片提供低于零下273.14摄氏度的极低温度，这是超导量子芯片最喜欢的温度。“这个小小的芯片就是量子计算机的心脏。”陈澄说，“越冷静的状态下，它算得就越快，这是宇宙中最寒冷的地方，超导效应在此产生。”

▲ 陈澄在介绍超导量子计算机“乾始”。图 / 受访者提供

量子计算机的计算力快得惊人，如果要对一个300位的大数进行质因数的分解，哪怕是全世界最顶级的传统计算机，也需要10万年以上才能计算出来。但在这里，仅需1秒钟，便能得到解决——这就是量子计算机的威力。

为了搭建这样一台量子计算机，百度花费了巨大的成本与精力。团队都是从全球最顶尖的高校科研院所招揽来的精英。陈澄是北京大学物理的博士，在北大读博的时候就主攻超导实验研究。在实验室时，陈澄通过显微镜观察微观尺度下的一个个原子排布，以及它们之间的相互关联，不禁惊叹于自然的神奇与奥秘。同时，她也对超导材料的实际应用产生好奇，想知道量子技术对我们的生活会产生怎样的改变和影响。

她想将自己的研究在产业内落地，但这个时期还有些早，量子的产业化落地，暂时还具备一定的困难和挑战，需要脚踏实地一步一步地走，但陈澄心里知道，它就像一座灯塔，一定是未来发展的方向。

在此之前，传统计算已经统治了70多年的时间，人们也开始迎来了数字化时代的爆发，大家在网络上信息往来、完成交易、沉淀数据，维持信息化时代衣食住行的运转。时不时的“宕机”开始成为某种时代症候，传统计算机不堪重负。陈澄觉得，或许量子计算即将迎来发展的关键临界点。

我们现在使用的手机、电脑、平板等，最底层的芯片都是由半导体晶体管组成的电路。在逻辑上，这种半导体晶体管组成的电路将逐渐逼近极限，如果没有新的技术替代，到2040年，计算机的耗能将可能超过总发电量——这太恐怖了。

但量子计算不一样，这是一种全新的计算范式，它带来的不是倍数算力的提升，而是指数级的提升，能对经典应用场景起到加速的作用，极大丰富量子产业化的应用场景，比如对人工智能、金融科技、新能源以及医药化工等多个重要领域带来革命性的推动作用。

陈澄想把自己对这个行业的前瞻性研究落地，但进行量子研究的产业化平台并不多，得知百度要建一个量子实验室，这与陈澄想要进一步了解超导量子计算行业的初衷不谋而合。而这里，几乎代表了最先进计算力的触探。

量子实验室建设期间，陈澄每天往返于海淀与亦庄之间，亲眼见证百度超导量子计算机“乾始”硬件平台的搭建，一开始只是一个设想，接着是一层又一层的“金钟罩”的加固，直到今年8月，那个白色的大罩子也套上了。实验室挂牌那天，陈澄非常难忘，她和团队的努力正在一步步实现。

2022年8月25日，那台搭载着量子芯片，连接着软件和应用的“乾始”正式发布。一起推出的，还有全球首个全平台量子软硬一体化解决方案“量羲”，可以为企业提供一站式产业化量子升级服务。陈澄介绍，在任何地方都可以便捷地使用“量易伏”App，与远在亦庄的百度量子计算机相连。每一个量子爱好者在手机上就可以访问“量子作曲家”模块，选择在量子模拟器或真实量子计算机上，“跑”一个自己的量子电路，亲身感受量子计算的魅力，成为那个世界上计算最快的“人”之一。

不同于以往的量子计算机，“乾始”是一台集“应用、软件、硬件”三位一体的高度集成的产业级超导量子计算机。这意味着“乾始”不再是一个“裸机”，而是可以“开箱即用”。

“乾始”的出现，让量子算力走出实验室走向产业化，变得触手可及，也标志着中国在量子计算产业化道理上进入全球第一梯队。

在这样一个实验室里，陈澄正将自己的设想转变为现实。从小，她就是个动手性极强的孩子，脑子里充满各种奇奇怪怪的问号，她想探求物质世界的本质，尽管在传统观念里，这条路径上的女性鲜少，但她觉得，“只要遵循自己的兴趣和爱好，去选择自己喜欢或擅长的领域，与性别无关，都能实现自己的价值。女性同样也可以通过自己的知识技术，用细腻和敏锐的视角在前沿科学领域，甚至是社会各个领域中贡献自己的力量。”

量子计算已经不再遥不可及。如果把陈澄和百度量子的工作比作先点亮的一盏灯，围绕着它，将吸引千千万万、志同道合的伙伴一起，共同为中国量子计算产业化和量子计算生态的努力，力争实现“人人皆可量子”的美好愿景。

▲ 图 / 视觉中国

小宇宙

对技术的信仰和追求，也从百度内部延伸到更广阔的地方。百度长期以来重视技术人才的挖掘与培养，通过设立奖学金的方式来加速国内AI人才建设体系。在2022年百度奖学金的评选中，来自清华、上交大、中科大、麻省理工等国内外顶尖高校的10位学生脱颖而出，他们的研究领域，覆盖智慧医疗、自然语言处理、计算机视觉等多领域。而这一届百度奖学金的获得者洪逸宁，也是人工智能领域的女性新生力量。

技术道路上的好奇和探索，往往来自于一个浪漫的想法。儿时，洪逸宁有50多个芭比娃娃，每一个长得都不一样，它们有各式各样的衣裳。她喜欢给它们换衣裳，穿上，脱下，再穿上——娃娃是她童年最好的玩伴。

那时的洪逸宁总会想象，在一个平行时空里，这些芭比娃娃会有自己的性格、爱好，喜欢的食物，能跟自己对话、玩闹。只是现在，它们都不够聪明，读不懂她的心事，听不懂她弹得钢琴，暂时还没办法跟她交流。

再长大一些后，她发现，她会在和人对话时突然神游天外，开始“翻译”自己脑子里里天马行空的幻想。她突然有了一个想法，想把脑子里的这个“小宇宙”造出来，创造一个AI形象，日夜陪伴着自己，她想着，随着时间的相处与磨合，它也会越来越懂自己，成为自己最好的玩伴。

这个想象太大胆了。她在两部美剧里看到过女黑客，手指轻点，便能进入另一个世界，“超帅！”。在高考志愿表上，她填下上海交通大学工科实验班，本科毕业后，又去加利福尼亚大学洛杉矶分校攻读计算机硕士，一年后顺利转为博士学位的攻读。

她每天泡在电脑前，一遍又一遍地构想她的3D物理世界。在那个世界里，她创造出来的AI“小人儿”看到一幅画上的浪花，可以想象到大海，看到一盘食物，可以想象出味道，这些都要通过打开AI人物的五官与大脑，用眼睛看，用鼻子闻，用大脑进行推理与判断，从而做出最符合逻辑的反应。

在计算机领域里，这也是2D图像超越模式识别，能够在3D空间中进行常识性推理与反应的重要命题。在这个领域，IBM美国研究院首席科学家淦创、计算机视觉专家朱松纯教授和吴英年，都在孜孜以求地探索，一寸一寸地往前触探，他们也都是洪逸宁的领路人。

但这条路的起点，并不顺畅。等真正学了计算机，洪逸宁才发觉，那些繁复的编程，她很难提不起兴趣，艰涩的代码真正上手做起来，也没有美剧里的黑客那么轻巧，“怎么学都学不会，就去死记硬背，但完全行不通”。成日泡在琴房弹钢琴成了洪逸宁的日常，一弹就是半夜，直到第二学年，闯进智能物联网专家王新兵教授的实验室，参与到数据可视化的工作，洪逸宁才突然发现，“计算机原来也可以这么具备美感”。

那份工作是，在某个领域找到许多作者的论文，找出不同论文之间的联系，然后用地图的形式将这些论文实现可视化。当自己第一次改出代码运行出来，洪逸宁惊叹道：“我画出的地图就像一个星空，里边有很多星星，那些教授和作者遍布其中，我越去构建代码，这个地图就越具备美感。”

之后的日子里，她就变得主动多了。她负责运营学院的一个学术型公众号，通过这个公众号，要给读者传递某一领域最前沿的学术信息，每一篇文章的诞生，都要看上千篇论文，“至少耗费两三个星期，太烦了”。这个古灵精怪的姑娘跟实验室同伴说：“要是AI能帮我们阅读这些论文就好了。”

就这样，几个小伙伴花费了半年，研究出一个自动读论文的模型，这个模型可以迅速阅读论文，获得出论文的主要观点、使用的主要研究方法。后来，她写一篇公众号文章的时间只需要一天，这个模型在同学中流传，成为大家速读论文的“利器”。那是她第一次感觉到，自己的创造竟然能给身边人带来这么实际的便利。

洪逸宁把这套模型的研究方法写成论文发表，紧接着，便收到了夏威夷一场学术会议的邀约。在夏威夷，有人来看她的论文展板，也跟她交流学术，她开心极了。最要紧的是，会上那些侃侃而谈的教授们，“都在做着我看不懂的工作”。在洪逸宁眼里，“她们是发着光的”。“我就想，她们也是从本科生一步一步长成今天这个样子的，我也想长成那样。”临近毕业，洪逸宁决定：“我要去国外读博，我要过去看一看。”

▲ 洪逸宁在2022国际人工智能顶尖会NeurIPS上介绍自己的论文。图 / 受访者提供

在UCLA，洪逸宁离造出那个理想中的AI“小人儿”更近了。她把这个“小人儿”的小宇宙进一步分解，就像一个每天都在感知图案、语⾔、声⾳的婴儿，它能慢慢长大，认知3D世界，和人交流合作，观察和体验不同物体的⽤途，慢慢叠加成知识、常识和记忆，叠加成区别于他人的内在模型。再⻓⼤⼀些，它要开始学会利⽤这些内在模型进⾏推理。

目前，AI技术发展飞速，已经可以识别出物体，并且描述出来，但没有完全形成常识和记忆，很难解释它们看到的事情，也很难与这个3D的真实世界进行互动，更难进行推理。洪逸宁想让AI拥有这些功能，尽情地探索这个世界。

但落地实现上，洪逸宁经常感到“痛苦”。她看到一本心理学书籍的封面上画了一个水桶，就想到：“如果这个水桶没有办法倒出水怎么办？”那么，可以设计一个AI修理工进入房间去修理它。当这个AI修理工进入房间提水桶时，它手的位置要主动选择在哪里，使用多大的力，水桶可以提起来，水的流动又会让水桶的轴产生多大角度的旋转，修理工会如何控制，甚至于水桶倾斜到哪个角度，水又会洒出来……这些都是洪逸宁要考虑的问题。这要涉及物理学、数学，甚至是心理学的内容，每一层技能的叠加，都是难度再上一个台阶，她要一遍又一遍地去调换参数去模拟试错，做到最难受的时候，甚至成宿成宿地睡不着觉，“觉得整个世界都崩塌了”。

她甚至会在夜里两点，在知乎上去检索：“什么样的人适合读博。”翻到了最后，内心的小宇宙跑了出来，“不读下去会后悔”，于是，再回过头继续去做。这样的焦虑，每一年都会跑出来两三次。

直到最近，这个研究终于有了新进展，这个AI修理工不仅会提水桶了，它还能推断物体的远近与大小，这一学术成果最近发表在了《CVPR2022》上。在现实生活里，这套技术可以在许多场景应用，比如做人类的AI助理，陪伴并帮助他们下判断，也可以给盲人做AI引导，帮他们规划、识别最优的路径，并带他们过去。“心里的大石头终于落了地”，而随着石头落地成形的，还有洪逸宁理想中的那个AI“小人儿”。

吴华、陈澄、洪逸宁，她们处于人生和科研的不同阶段，但同样对技术有着坚持和信仰，获得了百度最广阔的支持。她们的事业，与百度对技术的探索深深交织在一起，而百度对技术的探索精神，也通过她们不断流转蔓延，成为一种信仰和方向。在百度浩瀚的技术海洋中，这些女性独有的细腻、敏感的力量，也会将科技的边界拓展得更宽。

如今，在探索技术的星辰大海上，“她力量”正在绽放着璀璨的光芒。而这种光芒，也正闪耀在每一个穿梭在百度办公园区的女性身上。

今年的百度Create大会上，像吴华、陈澄一样的科技大咖们，也分享了百度在人工智能、量子计算这些领域的进展与思考。这是一场技术盛宴，也是有志者们的同行。而更多的技术信仰者，也会在未来与百度同行，一起去探索技术的星辰大海。

▲ 百度Create大会。图 / 受访者提供

每人互动

你了解百度AI背后的故事吗？

文章为每日人物原创

侵权必究

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章