中国高被引论文全球第一,是靠中国科学家抱团吗?
随着中国科技迅速发展,中国的论文产量和高被引论文占比已经排名第一。
今年6月,《经济学人》的封面专题“崛起的中国科学”引起各方关注,专题中一篇文章标题很直白地提出“中国已经成为科学超级大国”。根据这篇文章的报道,对于引用次数前1%的高被引论文,在2003年,美国的论文数是中国的20倍。而2022年以来的最新数据表明,中国的高被引论文占比已经超过欧盟和美国,跃居第一。
实际上,在论文被引次数这个指标上,中国也在飞速增长。
根据科技部中国科学技术信息研究所2023年度的《中国科技论文统计报告》,2013 年至 2023 年,十年间中国国际科技论文共被引用 6748.23 万次,相比上次统计引用数增加了 18.3%,排在世界第 2 位,美国仍然排名第 1 位。在 22 个学科中,中国在农业科学、材料科学、化学、计算机科学和工程技术 5 个领域论文的被引次数排名世界第 1 位[1]。
2007年至2017年,中国国际科技论文被引总数首次超越英国和德国,排名被引次数第二[2]。7年之后,中国总引用数已经是英国和德国的4倍左右。以现在的增长速度,中国国际科技论文被引次数成为第一,只是时间问题[2]。
然而,对于中国论文引用次数快速增长的势头,去年日本的一份报告泼了泼冷水。根据日本文部科学省的科学技术与学术政策研究所的《科学技术指标2023》报告,中国研究人员有很强的相互引用论文倾向。中国国际科技论文引用数量迅速增长背后的驱动力之一,可能就是这种本国学者之间的相互引用。
数据显示,在对引用国际论文的研究者所属机构进行国别分析时,中国的研究者在本国机构的论文引用中占比最高,达到61%。美国紧随其后,其研究者在本国机构的论文引用中占比为29%。相较之下,日本为19%,英国、德国、法国和韩国的研究者在本国机构的论文引用中所占比例较低,大约在10%左右[3]。
今年,发表在NBER上的一篇工作论文(working paper)也提出了类似观点:中国在科学文献引用方面的增长被高估了。在所有国家中,中国有着最明显的本土偏见(home bias)。
中国论文高引用数量,难道真是靠本国学者之间相互引用、抱团撑起来的吗?
中国科学家偏爱抱团吗?
这项研究由华东理工大学商学院讲师邱姝敏、麻省理工学院斯隆管理学院皮埃尔·阿祖莱(Pierre Azoulay),慕尼黑大学经济系的克劳迪娅·斯坦文德(Claudia Steinwender)共同完成。通过科睿唯安的期刊引文报告 (JCR),作者选出了2000到2021年,各领域前十分之一的461种顶级期刊,衡量这些期刊发表论文的引用情况。
研究发现,所有主要国家和几乎所有研究的科学领域中,中国在论文引用中都出现了明显的本土偏见,也就是说,即使在考虑了各国科研论文产出规模的基础上,本国研究论文更可能过度地被本国研究人员引用的现象。
按照作者们的统计,中国论文在中国本土的引用中所占比例最大,为 57.2%。美国的引用也有很大一部分来自国内,占 37.1%。这个分布和前述日本的报告相似。然而,中国和美国研究人员众多,从规模上考虑也有更大的自引可能性。要正确衡量本土偏见,就要衡量论文“引用比例”偏离了论文“生产比例”(一国论文发表占世界的比例)的部分。
经过调整,中国本土偏见为 42.3%,仍是各国中最明显的,美国为15.9%。这种现象不仅限于某个特定的学科领域,在20个科学分类中的18个,中国均显示出最强的本土偏见。从时间上看,中国的论文引用从2000年开始就有明显的本土偏见,而且20年来本土偏见还在一直增加,到2018年已经超过美国一倍。
如果说引文的本土偏见影响了总的被引数量,这个影响有多大?从论文引用总数来看,调整本土偏见后中国顶刊论文的总引用数排在世界第四位,前三位是美国、英国、德国。
邱姝敏补充,如果和《中国科技论文统计报告》一样统计十年间的论文被引次数,2007到2017年中国总被引数仍然能够成为世界第二,只是在调整本土偏见后和引用数第一名美国的差距更大,是美国的23%。
具体到研究领域,美国在各领域的引用数都保持领先,而中国在化学、材料、工程、计算机科学和农业科学方面是第二名,还没有成为第一。中国的篇均引用数则一直在第12至15名之间徘徊,离第一梯队有较大距离[4]。
但今天,中国的科研产出无论在数量还是高质量论文方面都已位居世界前列。然而,中国拥有最明显的本土偏见,意味着相比中国学者在顶刊上的产出体量和质量,他们在国际学术界的影响力明显更低。
至于中国的本土偏见为什么高,本国学者愿意抱团互相引用可能是一个答案,也比较符合大家对于中国学术界看重关系的第一印象。但邱姝敏解释,这个问题背后有两种可能的逻辑。
第一种是抱团的逻辑,就是中国学者们太愿意引用圈子里的“自己人”了。另一种逻辑是,外国学者对中国学者的论文引用太少了。这样即使国内学者并没有过度自引,从引用的比例来看也会呈现出研究成果国际流动性不足,集中在本国内部传播的现象。
哪一种逻辑影响更大?邱姝敏做了一个数据补充。美国学者的顶刊论文参考文献中有34.6%都来自本国。反观中国科学家的顶刊论文,参考文献中本国学者论文的比例只占14.8%,这个比例只排在世界第五。
也就是说,其实每位中国学者引用的本国同行论文的比例并不高,但因为没有太多国外学者引用中国学者的学术成果,“引用池”相对浅,导致中国的自引比例在统计上异常突出。而尽管美国学者在参考文献中引用了34.6%的本国学者,但考虑到全世界都在引用美国学者的论文,这种自引比例在整体上得到了稀释,美国学者的自引现象看起来也就不那么显著。
不过,外国学者更少引用中国学者,到底是因为论文的质量问题,或者是其他文化和语言上的原因?如果说论文质量相近的情况下,中国学者的成果在国际上的引用会不会打折扣,会打多少折扣?为了解决这些问题,作者们进行了另一项研究。
国外科学家为什么更少引用中国成果?
这次的研究专注化学领域,作者们首先统计了2000至2018年间在三本化学顶刊至少发过一篇的PI,再在其中选出前1%的明星科学家,去掉美国科学家后,收集751份非美国明星科学家的简历。其中有21%即156人来自于中国大陆,其余595人来自美国之外的其他国家和地区。作者收集了这些明星科学家成为独立PI后的所有文章。
作者采用了精细的匹配方法,以控制潜在的论文质量差异。通过多个变量进行匹配,包括期刊、发表年份、作者数量、非美国来源的引用次数、科学家获得博士学位的年份等,以求在质量相同的情况下,比较中国PI的论文和其他非美国PI的论文在美国这个第三方被引情况如何。
研究发现,即使在控制了研究质量之后,中国PI的文章平均收到的来自美国学者引用比其他非美国PI少28%。几乎在所有年份,都出现了这种引用上的折扣[5]。
对于这种引用上的折扣,团队检验了许多解释。首先这种折扣并非出于歧视,邱姝敏介绍,她和合作者调查了40名海外(美国除外)和香港华人PI的论文引用情况,发现他们的文章并没有区别对待,相比非华人的海外学者,这些华人甚至得到了美国学术界更多的引用。
其次,在学术声誉上,一些领域国外学者可能因为考虑到中国频繁出现的撤稿问题,而对引用中国作者的论文持观望态度。然而,数据并不支持这种假设,尽管因为频繁撤稿受到质疑,但那些撤稿频繁的领域中,中国科学家的论文引用率并未受到显著的负面影响。
另外,有猜测认为是中国学者集中的领域过于小众,导致国际上的引用比较少。但作者们检验了中国特定子领域的专精是否会影响其研究在美国的引用率,结果并没有显著的影响。
作者自己最支持的假设是,美国学者对中国的研究成果不够了解,中国学者在国际上的认知度(awareness)还不够。
持续深耕、专注于自身领域的研究,能帮助中国学者减少引用上的折扣。不过这仅限于那些在子领域重要性分布中处于最顶端的、极度专注的PI,也就是那些在自己专业领域内达到顶尖水平的研究者。
更明显的影响来自学术网络。研究发现,受过美国训练的海归中国科学家在美国引用更高,虽然不能将引用折扣完全消除,但是能消除掉一半的引用折扣。另外一项发现是,如果引用文章的作者之一有中国名字,那么他们引用中国科研成果的频率与引用其他国家的科研成果相当,不会出现显著地引用次数减少的情况。
这可能意味着,中国研究人员在美国有更多机会与华裔研究者接触,这样的交流增强了华裔学者对他们学术成果的了解。然而,与更广泛的美国研究社群的互动似乎还不够充分。这种学术网络的局限性,可能限制了中国学者在国际学术界的认知度。
“海归科学家以及在海外的华人,在中国学术知识扩散的过程中起了很重要的作用。从美国归国的华人科学家会更少地受到负面影响。另一方面,在海外工作的华人学者也更多促进了中国学术知识向外的扩散和流动。”邱姝敏说。
但在2018年中国行动计划后,中国之间以海外华人和海归科学家为桥梁的学术网络,变得更加脆弱。
邱姝敏进行了一个AI领域中国论文合作者的研究,发现2018年到2021年期间,AI领域美国虽然和中国之间的合作比例出现了下降,但和OECD国家以及其他国家的合作比例上升,维持了整个领域的国际合作比例。同样是这段时间,中国和美国、OECD国家以及其他国家的合作全面下降。中美在科学合作方面的紧张关系,给中国学术成果在国际上的影响力带来了更多的不确定性。
AI领域中国论文合作者的变化。作者提供
而在中国论文发表数量及其中的高质量论文数量都迅速增长的今天,相对不足的国际影响力,应该是学术界接下来关注的重点。
邱姝敏向《知识分子》解释,从创新经济学的角度讲,知识的价值来自于知识的积累和扩散。中国现在确实在科学上投入了大量的人力和资金,也有了相应的产出。但只是生产大量的知识是不够的,知识需要扩散才能发挥出经济和学术上的价值。
在一次讨论中,邱姝敏的合作者曾经这样说过:“中国有很多顶尖科学家,在科学上的投入和产出也都很多。但是谁站在中国学者的肩膀上做研究?如果只是生产了大量的知识,但没有人去运用这些知识,这也是一个问题。”
她和合作者选择开展这几项研究,就是为了探究在近年来中国论文发表总数及其中的高质量论文数量迅速攀升的背景下,这些知识多大程度上扩散到了全球的科学社区,多大程度上推动人类认知前沿向前发展?
“现在中国论文数量也达到了,质量也提高了,接下来应该关注的是你的研究有没有获得相应的影响力和话语权?对整个全球科学社区的发展和对人类认知前沿的推动做出了多少贡献?”邱姝敏说。
参考文献:(上下滑动可浏览)
微信扫码关注该文公众号作者