如前,本次周报我们继续:
2)和朋友们分享约翰·霍普金斯大学数据库停止更新的消息及其给我们带来的思考。最近两周全球单日新增病例较前降低17%,全球平均每天新增14万病例,到了2020年7月以来病例数的最低水平。(COVID-19新增病例数变化。图源:纽约时报疫情跟踪器)从最近1周新增病例绝对数看,美国单日确诊病例最多,单日新增病例数为3.8万人;其次是德国、日本、俄罗斯和韩国等。需要说明的是,数据世界的可视化资料数据来源于约翰·霍普金斯大学的数据中心,采集的数据来源均为各国权威部门发布的数据。(3月3日,从新增病例绝对数看,美国单日确诊病例最多。图源:数据世界)
3)美国疫情变化
2023年3月4日,美国CDC更新的突变株数据显示,XBB.1.5突变株已经占到89.6%。
XBB.1.5居榜首已很久了,依然没有其他新突变株出现。
(美国疫情。图源:纽约时报疫情追踪器)
B,约翰·霍普金斯大学将停止实时 COVID-19 数据报告
随着新冠疫情日趋平稳,全球最通用的COVID-19数据库及仪表盘也将于3月10日停止实时更新。
约翰霍普金斯大学新冠数据库获得2022年度拉斯克奖
2022年9月28日,美国Albert and Mary Lasker基金会宣布了2022年度拉斯克奖的获奖者【1】,来自于美国约翰·霍普金斯大学的Lauren Gardner获得公共服务奖,以奖励其对“创建 Covid-19 仪表板/数据库,为实时传播权威公共卫生数据设定了新标准。”Lauren Gardner创建的 COVID-19开放数据库,已经成为实时传播权威公共卫生数据设定了新标准。通过启动这一全球 COVID-19 监测工具,她提供了有关新发传染病传播的可访问且可靠的信息,从而填补了国际公共卫生系统的空白并建立了可效仿的模型。这一开创性的资源在大量错误信息环绕的网络中,为民众知情和个人选择开辟了道路。(图源:约翰·霍普金斯大学的COVID-19数据库/仪表盘)
在读纽约时报的报道中,有一个细节让我很感动【2】。On Jan. 21, 2020, a doctoral student of hers, Ensheng Dong, approached her about tracking cases of a novel pneumonia in his home country, China. Mr. Dong had the tools: He could mine Chinese websites for early case data, and he knew how to build online maps. (2020 年 1 月 21 日,她的博士生Ensheng Dong来找她,询问在他的祖国中国追踪新型肺炎的病例。董先生有工具:他可以挖掘中国网站以获取早期案例数据,并且他知道如何构建在线地图。)而在拉斯克奖网站的介绍中,指出“初期,Gardner 的团队对中国数据的追踪依赖中国医疗专业人士在线社区 DXY.cn(丁香园 - 编者注)”。
A,约翰·霍普金斯的“系统科学与工程中心(CSSE)”的新冠数据库如何在众多数据库中脱颖而出?B,新冠病毒数据库创建的其他两个关键角色(董恩生和丁香园)如何了?(我们最早期关注的新冠来源站点)
初期,我们使用最多的是丁香园公布的病例报告及地图。为了更多掌握中国内地以外的病例信息及了解这个传染病,我们收集到了很多在线资源。既包括美国CDC和中国CDC的新冠专区,也有新英格兰医学杂志(NEJM)这样学术期刊的新冠专题,还有科学家的推特,更包括众多的开放数据库。这些数据库由牛津大学、约翰·霍普金斯大学及其他机构创建。近三年过去了,这些网络资源及数据库都在人们了解疫情、科学家研究疫情、政府监测疫情中起到重要作用。
但作用最大的无疑是约翰霍普金斯大学CSSE的新冠数据库,及牛津大学“数据世界”根据CSSE数据库做的可视化网站。(Gardner 与 COVID-19 仪表板。图源:Lasker Award)
沿着拉斯克奖官网的介绍,我们一起看美国约翰·霍普金斯的Lauren Gardner如何获得成功的。(A bright idea for research, a golden idea for humanity)美国约翰·霍普金斯大学的Lauren Gardner教授研究人们的行为以及其他因素如何影响疾病传播。2020 年 1 月 21 日,她与研究生董恩生(Ensheng Dong)会面,讨论疫苗犹豫如何导致麻疹风险。过程中,董同学提到,他最近在关注着祖国新出现的新冠肺炎病例,自己有技术通过网络地图追踪和显示这些病例分布。最开始他们也只是认为这只是小众人群关注的信息,所以使用名为 Esri 公司开发的可视化软件、董同学把数据库建在自己的google服务中。八个小时后,董同学即建好页面。红点的大小代表病例数,总共 322 例,点缀在一张亚洲地图上。2020年1月22日,Lauren Gardner教授通过推特宣布:“我们正在实时跟踪 2019-nCoV 的传播情况。案例和地点可以在这里查看;可供下载数据。”(2020年1月22日,Lauren Gardner发布了对于该数据库上线第一天的推特。图源:Lauren Gardner的推特)
他们也没有想到新冠疫情会席卷地球,蜂拥而至的访问者很快崩溃了原有的服务器。由此该团队将资源移至 GitHub,这是一个基于 Internet 的数据存储库服务,还包含通信和文档功能。到月底,该资源已收到超过 10 亿条信息请求。最初,Gardner 的团队依赖中国医疗专业人士在线社区 DXY.cn,该网站按中国各省和其他国家/地区跟踪病例,尽管该网站没有及时报告中国以外的病例。下图是“Hanson临床科研”公众号于2020年1月21日采用的丁香园疫情地图(只有中国疫情图,而没有海外疫情图。)。
就在这一天,约翰·霍普金斯大学的新冠疫情图,以丁香园数据为基础发布。
尽管当时日本、韩国、泰国、美国都已经有了新冠病毒,但由于约翰·霍普金斯大学的新冠疫情图数据来自于丁香园,所以只是展示了亚洲的情况地图。
但约翰·霍普金斯大学的新冠疫情图已经超过了丁香园的展示范围。
从这天起,“从学习、到超越”被再现。
🔺我们公众号于2020年1月21日采用的丁香园疫情地图。丁香园只做了中国疫情图,而忽视了海外疫情图。就在这一天,约翰·霍普金斯大学的新冠疫情图,以丁香园数据为基础发布。截图来源:Hanson临床科研公众号。
随着病毒的扩散,科学家们手动梳理了非常规的信息来源--例如媒体渠道和公共卫生官员的推特帖子。但随着疫情爆发成大流行病,手动搜索数据变得不可持续。Gardner 在系统科学与工程中心的研究小组和她在约翰·霍普金斯大学应用物理实验室领导的另一个小组编写了计算机程序,以自动从每个来源“抓取”数据。他们还开发了异常检测软件,可以标记可疑的数据变化,并在团队调查这些突然的偏差是否真实时保留这些数据。Gardner 的团队审查每条有问题的数据,找出突然飙升或下降的原因。只有在验证它之后,他们才会在 GitHub 中发布它,它会提供地图。
通过这种质量控制机制,最多程度控制了错误信息被传播到仪表板。
(Information epidemic)
约翰·霍普金斯大学的新冠数据库已经成为全球最可靠的新冠信息来源。尽管许多机构、市政当局和国家建立了自己的新冠数据库,但 Gardner 的空间分辨率在大型数据聚合器中是无与伦比的。它仍然是大流行病的流行病学记录的金标准,并将继续发挥重要作用,因为人们回顾性研究 Covid-19 并制定公共卫生数据收集、监测和显示的方法。通过她富有远见的工作, Gardner 构想并推出了一个开创性的数据库,使世界第一次能够观察大流行病的发展过程,她将未来的健康危机与这一基准挂钩。及时、准确和可获取的信息,对于制定灵活合理的策略来对抗迅速蔓延的疫情至关重要。通过提供对新冠疫情最快速而准确的信息传递,美国约翰·霍普金斯大学的Lauren Gardner团队创建的新冠数据库使公众、媒体、政策制定者、企业和学者能够跟踪新冠病毒的传播,做出明智的决定以降低风险。除此之外,我们更应该记住董恩生(Ensheng Dong)这个名字。(Ensheng Dong)
董恩生更是充分运用自己的知识,一起改写了流行病监测的方式。(董恩生的研究被引用次数超过1万次,即达到Top级学者之列)
在完成对整个故事的回顾后,我们更想请教朋友们三个问题。
很难。初创者的个人能力和意愿将是做大的最大制约。因为想到一件事很容易,做成不易、想做到最强则极难。
看看Lauren Gardner怎么做到的。创意来自于学生、技术来自于学生,面对这种情况,Lauren Gardner2),最重要的是把握住了宣传出口。第一时间在推特上宣布“我们做到了!”。3),根据需要招募和创建新团队,将自己置于领导者的位置。Lauren Gardner坚持做:招人做强业务、自己全力推广。(推广:Gardner与科学记者讨论她的仪表板。图源:Lasker Award)
2,个人如何避免被挤出核心圈?
说实话,我们很为董恩生鸣不平。
创意是董恩生的、最初的构建是董恩生的。但是不仅奖项与他无关,搜索美国媒体,对于他的报告很罕见。
要知道,很多诺贝尔奖会同时奖励导师及其学生。
不知具体情况,我们不做太多评价。
只是想说一下美国朋友圈讨论最多的:为什么技术最好的中国人总干最苦最累的活、而印度人却占据了美国最大公司的大部分CEO位置?
我的观点是:个人意愿决定了大结局。
刚来美国时在实验室工作。我是最勤奋的,出的研究结果和论文也最多。与比我早来2个月的印度人在一个房间办公,她的工作量不到我的1/3,但是她每天都会去老板娘那里沟通。两年后,我成了实验室干活的主力,一遇到难做的实验,我成了第一接盘侠啃硬骨头身心疲惫;而她,成了大半个lab manager。讲这个故事,我只是想表述:我们在做事时、对自己的最终定位,决定了我们的行动方案,也直接决定了自己以后的位置。很多时候,我们努力做一个我们自认为勤奋、正直、善良的人,并不屑于争抢位置;但领导却会认为任劳任怨是你愿意做的、或者这就是你适合的位置;而其他人却利用你的退缩,而抢功上位。只是一个学生角色?还是项目的管理者、甚至一个未来公司的创建者?这个定位决定了他继续闷头做挖掘,还是借助这个项目推广自己、及提升自己的管理能力。3,丁香园为什么没有做出约翰·霍普金斯大学新冠数据库?丁香园的新冠病例报告板创建的最早,董同学最初用的数据也全来自于丁香园;结果却是:丁香园在这个改写了公卫流行病监测方式的“新冠动态报告板发展”史,只存在于一句描述的话语中。
而对比本文中同样展示2020年1月21日新冠疫情的DXY图和CSSE图,你会发现:尽管来源于丁香园的数据,尽管约翰·霍普金斯大学CSSE图还是只展示亚洲(当时美国已经有了病例),但从那时起,疫情报告就不被局限于仅展示中国的疫情。
初心,即决定了大结局。
【1】 https://laskerfoundation.org/winners/noninvasive-prenatal-testing-using-fetal-dna/【2】 https://www.nytimes.com/2022/09/28/health/lasker-award-medical-research.html本公众号仅作已发表研究论文的数据分享和解读,仅供学术讨论,而不具临床指导意义。
Hanson临床科研团队,由6位在美国的医生及医学科学家组成;目前在美国主要从事新药研发和临床科研。