前几天,著名的结构生物科学家颜宁宣布将辞去美国普林斯顿大学教职,回国出任深圳医学科学院创始院长的消息在网上刷屏,并迅速冲上了热搜第一。2014年,颜宁带领一个平均年龄不到30岁的团队,只用了6个月时间,首次解析了人源葡萄糖转运蛋白GLUT1的晶体结构和工作机理,成功攻克了横亘在全世界分子结构科学家面前长达50年的一个难题,这一成就也使得颜宁收获了无数的荣誉。而这样的研究成果并没有引发网络舆论的广泛关注。最大的两次争议,一次是离开,一次是回来。当年那些骂她出国动机的人,批评清华留不住人才的人,转头又开始质疑和嘲讽她回国的目的。非常有趣。颜宁此次回国最主要的争议是:”据说她在美国已经学术破产干不下去了,因为她的工作已经被AI取代了。” 很多完全不懂科学、不懂AI的键盘侠们抱着一种幸灾乐祸的感觉吃瓜。一篇网上热转的文章,开头就用极其夸张和简单的几句话概括了整个事件。麦教授这两天在各个群里很多次看到它,也多次收到别人私信询问。在吃瓜看热闹之前,不应该了解一些基本的事实吗?首先来看此次争议中的另一个主角——“AlphaFold”是什么?又做了什么?AlphaFold可以说是生物界的AlphaGo,它的所做出的贡献也被该领域的科学家们称为“划时代的进步”。同样出自于DeepMind公司AlphaFold,和横扫顶尖人类围棋职业选手的AlphaGo一样,分别在2018年(首次参加)和2020年国际蛋白质结构预测竞赛(CASP)上一举击败了其余的参会选手摘得头魁,并在生物学领域引发轰动。在DeepMind公开了AlphaFold的源代码之后,生物学界也掀起了一阵“AlphaFold狂热”的研究。AlphaFold诞生之前的50年中,科学家们需要进行大量的试错,耗费大量的时间和精力,采用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验手段在实验室中确定蛋白质的形状。1972年,诺贝尔化学奖得主Christian Anfinsen提出,理论上,蛋白质的氨基酸序列应该能够完全决定它的3D结构。这一假说让科学家们开始了基于氨基酸序列,通过计算方法预测蛋白质3D结构的探索。然而,这样的探索面临着极其重大的挑战,20世纪80、90年代用计算机预测蛋白质结构的早期尝试并不成功。AlphaFold的出现改变了这一局面。2021年,DeepMind宣布已经用AlphaFold预测了人体内近乎所有蛋白质的结构,以及20个其他被大量研究的生物体的完整“蛋白质组”,其中包括小鼠和大肠杆菌,累计共有36.5万个结构。而今年,DeepMind更是计划发布总计1亿多个结构预测——相当于所有已知蛋白的近一半,是蛋白质数据银行(PDB,Protein Data Bank)结构数据库中经过实验解析的蛋白数量的几百倍之多。颜宁的成就攻克了困扰生物学界50年的一个难题,AlphaFold的成就同样解决了困扰生物学界50年的重大挑战。所以就有人说:你看颜宁跟她的团队研究那么久才搞出来一个结构,AlphaFold一下子就能预测出上亿个,等于是把整个游戏都颠覆了,然后像颜宁他们这样的人当然是下岗没地儿去了,所以才回国的。呵呵哒。 这里面有几点需要思考:第一,现在小学生都知道的无理数和虚数在历史上花费了人们上千年的思考才出现,我们不能说之前那些数学家搞得就是小学生都懂的玩意儿。第二,AI的能力来自于前人积累的数据。AlphaFold之所以能够做到这件事儿,恰恰是因为前面有科学家做了无数的理论和实验的工作,它才有一个非常好的基础。AI是站在很多个巨人的肩膀上才能达到这样的高度的,如果没有这些科学家之前的结果,AI和机器学习是不可能自己学会做生物学研究的。三,科学家并不是只做这一件事,AI能做了他们就要被取代了。我不是颜宁本人,也不去揣测她对于机器学习的看法。但如果是我的话,我会很开心。因为这个研究如此复杂,如果AI能解决的话,那恰恰是可以把这些科学家从大量重复且繁重的实验中解放出来,让他们去研究更多更有意思的课题。其实就相当于我们发明了自行车、汽车,然后它们可以帮助人类行走,这并不是意味着人类就不需要走路了,而是说人把这个时间节省下来,给人类提供了更大的自由,可以让人去做更有意义的事情。第四,颜宁并不是在国外混不下去才要回国。颜宁这样的顶级的科学家,发了这么多《Nature》、《Science》、《CELL》,仅靠闷头做做重复性的实验是不可能的。没有发过论文的人凭空臆想以为只是努力熬夜做重复工作就可以发顶刊的论文了。井蛙不可语海,夏虫不可语冰。▼往期精选▼