Redian新闻
>
日本说中国高引用论文超越美国,这是怎么回事?| 袁岚峰

日本说中国高引用论文超越美国,这是怎么回事?| 袁岚峰

科学

导言:


在2021年,中国的高被引论文确实就比美国高了!由此可见,无论用什么样的统计,得到的都会是同样的趋势,不同的算法只是把中国超越美国的时间提前或者推迟几年。


最近,有一则消息引起了关注和不解:中国在高引用论文的数量上超过美国,成为世界第一。这个消息来自日本文部科学省8月初发布的《科学技术指标2022》(https://news.ifeng.com/c/8INEiqQgT2Z),然后《Science》也为此发表了一篇报道(https://www.science.org/content/article/china-rises-first-place-most-cited-papers)。


这个新闻引起关注是理所当然的,因为所有人都会关心世界各国尤其是中美两国的科技实力对比。它引起不解也是理所当然的,因为它似乎来得太快了。我以前多次介绍过科学文献计量学指标(《从2020年最新定量指标看中国的科技实力 | 袁岚峰》),如自然指数、研究前沿指数、高引用研究者等等,一般的结果都是美国第一,中国第二,中国在快速追赶美国。在一些指标上,如发表论文数,中国已经超过了美国。不过人们很容易说,这种指标重量不重质。如果要看质量,比如说高引用的论文数,中国就排在美国后面了。

这种格局我已经很熟悉了。没想到日本直接抛出一个中国成为第一的指标,而且这不是个无关紧要的指标或者重量不重质的指标,而是个核心的质量指标,这就很让人吃惊了。究竟发生了什么?其实首当其冲的问题是,日本这个报告对指标的定义是什么?数据来源是什么?

实际上,日本这个报告说的是,由于各年的数据波动巨大,取三年的平均,这次的统计时间窗口是2018年至2020年,把这三年的平均值称为2019年数据。首先来看顶尖论文,即各个领域被引用次数排名前1%的论文。在这三年的平均中,中国的顶尖论文有4744篇,占全世界的27.2%,超过了美国的4330篇和24.9%,更高于第三名英国的5.5%。再来看引用前10%的论文,中国也处于第一,占全世界的26.6%,超过美国的21.1%。相对于去年的数据24.8%和22.9%,中国的领先优势正在扩大。至于总的论文数,中国早就是世界第一,而且领先得越来越多。在这次的报告中是407181篇对美国的293434篇,多了10万篇,拉大了去年的报告中8万篇的差距。

中美英等国被引用次数排名前1%的论文篇数占比图

日本的数据来源是什么?它自称是来自科技情报公司科睿唯安(Clarivate)的数据。科睿唯安我们很熟悉,就是提供Web of Science等著名科学文献数据库的那个公司。然而直接去查Web of Sicence就会发现,定性结果不对:2018年至2020年,美国的SCI论文总数是178.6万篇,高被引论文(即过去10年中发表的论文,被引频次在同年同学科发表的论文中进入全球前1%)是22000篇,热点论文(即过去2年中所发表的论文,在最近两个月中其被引频次排在同年同学科前0.1%的论文)是578篇,而中国的这三个数据是152.5万篇、20079篇和469篇。每一个都跟美国很接近,但每一个都比美国低一些。所以,日本是怎么得出中国高于美国的结论的?



我联系到了科睿唯安的一位朋友,她也是我的一位热情粉丝。她告诉我,日本这项调查是基于自然科学领域的论文进行统计的,在标准化产品Web of Science和InCites中是没办法复现的。前者可以查自然科学领域的各国总论文数、被引前1%论文数,但不能查被引前10%。后者被引前1%和10%都可以查,但不能单独查自然科学,只能把自然科学和社会人文放在一起查(即SCI加上SSCI和AHCI)。因此,日本文部省应该是调用了Web of Science的底层数据,做了个性化统计。

听了她的介绍,我有些理解了。日本可能是定义了一套特别的标准,如只挑选了某些学科,或调整了时间点,按照这样的标准统计出来中国变得高于美国了。他们这样做的目的是什么,就可以自由理解了。可能是制造中美竞争的气氛,可能是制造焦虑感。因为无论以什么标准来排,日本都远远排在中美后面。在他们这个报告中,日本前1%引用的论文数只排在第12位,甚至低于韩国,比十年前的第六位大幅下降。如果站在日本人的角度上,不忧心忡忡是不可能的。

各国被引用次数排名前10%及前1%论文篇数排名,中国均位于第一

据Web of Science平台的统计数据,在2021年,中国的SCI论文有70万篇,高被引论文有9080篇,热点论文有931篇,美国的相应数据分别是63万篇、7332篇和938篇。在2021年,中国的高被引论文确实就比美国高了!由此可见,无论用什么样的统计,得到的都会是同样的趋势,不同的算法只是把中国超越美国的时间提前或者推迟几年。



最后,关于这些数据的意义,我想任何有思考的人都应该能认识到。如果有人还要嘟嘟囔囔一些老生常谈,如“中国的论文都是灌水的”,那只能说他连高被引论文这个词是什么意思都没有理解,处于没有脑子的复读机的状态。我以前在介绍科技指标的时候,就写过很多答客问,早已预见到并且回答了这种问题。任何人如果认真研究了这些数据,思考了这些问题,就能明白什么叫做世界大势。


■ 扩展阅读:
从2020年最新定量指标看中国的科技实力 | 袁岚峰
三个指标看中国科技实力,哪些领域已赶超美国成为世界第一?| 科技袁人Lite
2019科技袁人年度盛典演讲:没有人能阻止你努力 | 袁岚峰
中国科技的领跑、并跑与跟跑 | 袁岚峰
中国科技发展不靠任何人“恩赐”  | 袁岚峰
中国科技实力正以多快的加速度逼近美国 | 袁岚峰


■ 作者简介:本文作者袁岚峰,中国科学技术大学化学博士,中国科学技术大学合肥微尺度物质科学国家研究中心副研究员,中国科学技术大学科技传播系副主任,中国科学院科学传播研究中心副主任,科技与战略风云学会会长,“科技袁人”节目主讲人,安徽省科学技术协会常务委员,中国青少年新媒体协会常务理事,中国科普作家协会理事,入选“典赞·2018科普中国”十大科学传播人物,微博@中科大胡不归,知乎@袁岚峰(https://www.zhihu.com/people/yuan-lan-feng-8)。

■ 责任编辑:陈昕悦


关注风云之声 提升思维层次


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
热水加冷水会不会变成温水?对规范场论这是个问题 | 袁岚峰美国国债收益率如何?近期华人热议的回报率高达9.62%的美国国债又是怎么回事?理解杨振宁(二)千里共同途 | 袁岚峰疫情两年后欧洲三国游 (9)- 巴塞罗那巴特罗之家,Casa Batllo肿瘤骨转移是怎么回事?哪些肿瘤会发生骨转移?孩子身体抽搐、翻白眼、失去知觉是怎么回事?该怎么做?【快讯】今年H1B没有海底捞了?!怎么回事?怎么办?美国制造业占经济总量60%?这是怎么算出来的? | 袁岚峰私处异常出血、褐色分泌物,是怎么回事?美国宇航局NASA的副局长竟然被福布斯评为“全球50强50岁以上企业家 ”…这是怎么回事儿?为什么不再说“缺芯少屏”了?因为中国显示领先了 | 袁岚峰俄军哈尔科夫大败,是怎么回事?为啥孩子一起床就发火,“起床气”是怎么回事?科普有多重要?国家有哪些支持?这篇文章都说清楚了 | 袁岚峰佩洛西专机上的“弹孔”是怎么回事?直播2.5小时收入百万!B站虚拟主播再度火出圈,到底怎么回事?美国高法推翻罗伊诉韦德案是怎么回事生椰拿铁蛋糕卷(Coconut Coffee Swiss Roll)无题稀土到处都有用,为什么偏偏没有钢?| 袁岚峰《关于新时代进一步加强科学技术普及工作的意见》为什么让人喜大普奔?| 袁岚峰眼周长小疙瘩是怎么回事?有一种情况可能是扁平疣“整点薯条”和“依本等吃人度日”的异曲同工之处是什么? | 袁岚峰中国高引论文数首超美国,位居世界第一存5年不及存3年?多家银行存款利率倒挂,怎么回事?眼皮跳是怎么回事?出现这 4 种情况真的要注意了如何自学物理?绝世武功的目录在此 | 袁岚峰16个数论难题,你能看懂多少?解决多少?| 袁岚峰陕西将建成首个商用可控聚变堆?!十有八九是媒体乌龙 | 袁岚峰内忧外患紧逼,中国芯片的前途何在?| 袁岚峰李小璐“52部不雅视频”事件,是怎么回事?日本说中国高引用论文超过美国,怎么回事? | 科技袁人有手就能做的夏日冰冰凉 ~~* 抹茶红豆凉糕 *~~梅根自曝聪慧过人,却被迫持靓行凶!可跟网红鼻祖争“笨蛋辣妹”人设是怎么回事?小俩口和老俩口丰富多彩的周末
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。