耗时3年,400万名游戏玩家终于联手打败了最先进的计算机算法
图片来源:unsplash
众人拾柴火焰高。
撰文 | 黄雨佳
审校 | 不周
《无主之地》(Borderlands)是一款第一人称射击类角色扮演游戏。如果你玩过它的最新作——《无主之地3》,或许会对这样一个场景有些印象:“避难所3号”(Sanctuary III)飞船上有一个街机,点击它,你便会离开游戏主线剧情,进入一个复古的迷你游戏界面。
这个街机游戏看上去有些像俄罗斯方块,不同颜色的图案方块排成7~20列。你的任务是通过放置有限的间隔方块(下图中的黄色箭头方块),使每一列的图案方块尽可能地与最左侧的参考图案“对齐”,即将相同图案放置在同一行。对齐程度越高,分数就越高,奖励的游戏代币也越多,最高甚至可达数千枚代币,而代币能用来购买游戏皮肤和多种增加主线游戏武力值的升级包。
《无主之地·科学》的游戏界面(图片来源:DNAPuzzles)
全球共有超过400万名游戏玩家玩过这款名为《无主之地·科学》(Borderlands Science)的迷你游戏,你或许也是其中一员。你一定难以想象,如今,这款游戏创造的数据打败了最先进的计算机算法,并作为论文的“核心科技”,发表在国际顶刊《自然·生物技术》(Nature Biotechnology)上。
游戏?科学!
其实,这款迷你游戏中的每一列图案方块并非随机排列,而是有着真实世界的依据——肠道微生物的基因组序列。每一列图案方块都代表一个DNA片段,每种图案方块都对应一种DNA核苷酸(A、T、C和G)。这些序列来自人类微生物组研究项目Microsetta Initiative的一个子项目,共包含95.3万条肠道微生物的基因组片段,均位于16S核糖体RNA(rRNA)基因的特定区域。
在我们的身体上,只有43%的细胞属于自己,剩下的大多数“居民”都是外来的微生物。科学研究表明,肠道微生物与糖尿病、抑郁症和自闭症等多种疾病有关。如果能得知肠道中有哪些种类的微生物以及它们的亲缘关系,就能更多地了解肠道微生物的功能。而特定的基因序列越相似,通常也意味着两个物种的亲缘关系更近。
图片来源:pixabay
在《无主之地·科学》中,玩家看似是在对齐多列图案方块,其实是在帮科学家设计一种同时比对多条基因组序列的“算法”。游戏界面最左侧的参考图案是经计算机分析得出的这近一百万条序列的共同点,而玩家的操作实际上是在同时比对多个序列与样本“中间值”的差异。
你一定十分疑惑,比对相似的序列并获得高分,这听上去是计算机十分擅长的事情。我们的人工智能如今已如此发达,为何还需要游戏玩家来做这种事呢?这是因为,序列比对并没有标准答案,科学家无法给人工智能提供一个参考“题库”,告诉它输入某种序列后应该生成怎样的比对。
比对序列实际上是在两个相互矛盾的目标——对齐核苷酸和减少缺口(即游戏中的间隔方块)数量——之间寻找平衡点。下面,让我们以比对TTCATAGC和CTTGACTG这两个序列为例。
如果我们坚决不能忍受任何一个核苷酸与和它不同的核苷酸排列在一起,那么我们将会得到一个使用很多缺口的比对方案:
但这种比对并不能提供太多线索,告知我们两个序列之间是何种关系,毕竟它们看上去几乎没什么关系。所以,还是让我们来试试另一种极端的方案吧。这次,我们不能接受存在哪怕一个缺口!
嗯……相信你已经看出来了,这不就是压根没比对吗?!我们还是动动脑子,发挥人类的主观能动性,想一个“两全其美”的方案吧:
这下看起来就合理多了,它既体现了两条序列之间的相似性,同时又使用了尽可能少的“间隔方块”。当然,这并不是唯一解,你也可以尝试用自己的方式比对这两条序列,找到你认为的最佳方案,这就是人与计算机的不同之处。其实,《无主之地·科学》的设计者并非在追求更高的序列对齐程度,而是希望借由游戏玩家之手,了解人类可能有哪些解决此类问题的模式,其中哪种模式会被更多人类玩家采用。
之所以这样设计,是因为科学家很难凭空训练计算机如何权衡对齐与减少缺口。但对于人类而言,“直觉”就是我们最好的工具。而且,计算机的工作模式通常是两两序列进行比对,但人类可以在拿到多条序列时,以一种更全局的视角设计比对方案。于是,有了数百万名人类玩家提供的解法,科学家就能借用其中的相对最优解(即不比其他解决方案差的方案),用于训练计算机算法。
2020年4月7日,《无主之地·科学》正式上线。上线仅一年,玩家就贡献出了7500万个序列比对的解决方案(平均每个谜题43个方案)。截至2023年5月,共有超过400万名游戏玩家完成了至少一道谜题(不含教学关卡),参与率高达90%。实验结果表明,利用《无主之地·科学》数据得到的多序列比对算法,已经超过了其他此前最先进的多序列从头比对算法(PASTA、MUSCLE和MAFFT),它绘制了迄今质量最高的肠道微生物组的系统发育树。《无主之地·科学》也成了迄今规模最大、成就最高的公民科学项目之一。
其实,《无主之地·科学》背后的团队——大型多人在线科学(MMOS)公司早已推出过其他类似的项目。2010年,他们曾推出一款名为Phylo的在线休闲益智游戏。与《无主之地·科学》十分类似,Phylo同样是让玩家比对DNA序列,只不过数据来源是约一百个哺乳动物基因(包括人类基因)的启动子序列,规模远小于此次;而且科学家事先知道每条序列的来源,因此可以根据已有的信息评估玩家解法的优劣,但《无主之地·科学》中序列的这类信息并不为人所知。
Phylo的游戏界面(图片来源:DNAPuzzles)
从上图的游戏界面你就能看出,这款游戏长得十分“硬核”,很容易劝退普通玩家(参与率只有10%)。于是,MMOS公司在2019年决定开发一款规则更简单、更有趣、更容易被普通玩家接受的游戏。他们不仅缩短了游戏时长,还将它与一款热门的在线游戏结合,适配了游戏手柄,而且引入了奖励机制,甚至给小游戏的载体(街机)创作了一段故事,让它与游戏中最受欢迎的角色之间产生关联,以吸引该角色的粉丝。《无主之地·科学》就是这样诞生的。
《无主之地·科学》帮科学家重建了肠道微生物组的演化史,极大程度增进了人们对该领域的了解。因此,如果你也曾经玩过这款游戏,记得给自己点个赞,毕竟这项科学突破(和这篇顶刊)也有你的一份功劳哦!
https://www.forbes.com/sites/krisholt/2024/05/13/todays-quordle-hints-and-answers-for-tuesday-may-14/
https://www.nature.com/articles/s41587-024-02175-6
https://www.youtube.com/watch?v=L_mH6Ak_Ny0
https://dnapuzzles.org/2020/04/13/am-i-really-helping-by-playing-borderlands-science/
https://dnapuzzles.org/2020/07/08/decoding-player-submissions-identifying-the-best-answers-without-knowing-the-right-answer/
https://dnapuzzles.org/2020/08/17/from-phylo-to-borderlands-science
https://www.youtube.com/watch?v=z75u5MYITDo
本文来自微信公众号“环球科学”。如需转载,请在“环球科学”后台回复“转载”,还可通过公众号菜单、发送邮件到[email protected]与我们取得联系。相关内容禁止用于营销宣传。
微信扫码关注该文公众号作者