Redian新闻
>
全球最通用“新冠数据库”,由这位中国留学生创意、建站;导师获得“拉斯克奖”,并改写了公卫监测方法。我们能从中学到什么?

全球最通用“新冠数据库”,由这位中国留学生创意、建站;导师获得“拉斯克奖”,并改写了公卫监测方法。我们能从中学到什么?

教育

Knowledge is power. 

Bringing medical advances from the lab to the clinic.


关键词大数据分析;新冠数据库;学术


2022年9月28日,美国Albert and Mary Lasker基金会宣布了2022年度拉斯克奖的五名获奖者【1】,来自于美国约翰·霍普金斯大学的Lauren Gardner获得公共服务奖,以奖励其对“创建 Covid-19 仪表板,为实时传播权威公共卫生数据设定了新标准。

拉斯克奖委员会认为:
Lauren Gardner创建的 COVID-19开放数据库,已经成为实时传播权威公共卫生数据设定了新标准。
通过启动这一全球 COVID-19 监测工具,她提供了有关新发传染病传播的可访问且可靠的信息,从而填补了国际公共卫生系统的空白并建立了可效仿的模型。
这一开创性的资源在大量错误信息环绕的网络中,为民众知情和个人选择开辟了道路。

(图源:拉斯克奖官网

在读纽约时报的报道中,有一个细节让我很感动【2】。
On Jan. 21, 2020, a doctoral student of hers, Ensheng Dong, approached her about tracking cases of a novel pneumonia in his home country, China. Mr. Dong had the tools: He could mine Chinese websites for early case data, and he knew how to build online maps. 
(2020 年 1 月 21 日,她的士生Ensheng Dong来找她,询问在他的祖国中国追踪新型肺炎的病例。董先生有工具:他可以挖掘中国网站以获取早期案例数据,并且他知道如何构建在线地图。)

而在拉斯克奖网站的介绍中,指出“初期,Gardner 的团队对中国数据的追踪依赖中国医疗专业人士在线社区 DXY.cn(丁香园 - 编者注)”。

(约翰·霍普金斯的“系统科学与工程中心”新冠数据库的表盘。截图于2022年9月29日)


由此,我们更关心的是:约翰·霍普金斯的“系统科学与工程中心(CSSE)”的新冠数据库如何在众多数据库中脱颖而出?
新冠病毒数据库创建其他两个关键角色(董恩生和丁香园)如何了
我们能够从中学习到什么?

从2020年1月19日发布新冠第一篇推文“世界卫生组织建议:如何有效预防新型冠状病毒感染。武汉单日新增77例,深圳和北京开始有发病。”,我们就开始收集这方面的在线资料。

(我们最早期关注的新冠来源站点)


初期,我们使用最多的是丁香园公布的病例报告及地图。
为了更多掌握中国内地以外的病例信息及了解这个传染病,我们收集到了很多在线资源。既包括美国CDC中国CDC的新冠专区,也有新英格兰医学杂志(NEJM)这样学术期刊的新冠专题,还有科学家的推特,更包括众多的开放数据库。这些数据库由牛津大学、约翰·霍普金斯大学及其他机构创建。

近三年过去了,这些网络资源及数据库都在人们了解疫情、科学家研究疫情、政府监测疫情中起到重要作用。
但作用最大的无疑是约翰霍普金斯大学CSSE的新冠数据库,及牛津大学“数据世界”根据CSSE数据库做的可视化网站

Lauren Gardner是如何胜出的?

Gardner 与 COVID-19 仪表板。图源:Lasker Award

沿着拉斯克奖官网的介绍,我们一起看美国约翰·霍普金斯的Lauren Gardner如何获得成功的。

第一阶段:
研究的好点子,人类的金点子
(A bright idea for research, a golden idea for humanity)

美国约翰·霍普金斯大学的Lauren Gardner教授研究人们的行为以及其他因素如何影响疾病传播。
2020 年 1 月 21 日,她与研究生董恩生(Ensheng Dong)会面,讨论疫苗犹豫如何导致麻疹风险。过程中,董同学提到,他最近在关注着祖国新出现的新冠肺炎病例,自己有技术通过网络地图追踪和显示这些病例分布。
最开始他们也只是认为这只是小众人群关注的信息,所以使用名为 Esri 公司开发的可视化软件、董同学把数据库建在自己的google服务中。
八个小时后,董同学即建好页面。红点的大小代表病例数,总共 322 例,点缀在一张亚洲地图上。
2020年1月22日,Lauren Gardner教授通过推特宣布:“我们正在实时跟踪 2019-nCoV 的传播情况。案例和地点可以在这里查看;可供下载数据。”
这段文字,引发了一场公共卫生报告的革命。

2020年1月22日,Lauren Gardner发布了对于该数据库上线第一天的推特。图源:Lauren Gardner的推特


他们也没有想到新冠疫情会席卷地球,蜂拥而至的访问者很快崩溃了原有的服务器。由此该团队将资源移至 GitHub,这是一个基于 Internet 的数据存储库服务,还包含通信和文档功能。到月底,该资源已收到超过 10 亿条信息请求。

第二阶段:
强大的信息通道
(A robust data pipeline)

最初,Gardner 的团队依赖中国医疗专业人士在线社区 DXY.cn,该网站按中国各省和其他国家/地区跟踪病例,尽管该网站没有及时报告中国以外的病例。

下图是“Hanson临床科研”公众号于2020年1月21日采用的丁香园疫情地图(只有中国疫情图,而没有海外疫情图。)。

就在这一天,约翰·霍普金斯大学的新冠疫情图,以丁香园数据为基础发布。

尽管当时日本、韩国、泰国、美国都已经有了新冠病毒,但由于约翰·霍普金斯大学的新冠疫情图数据来自于丁香园,所以只是展示了亚洲的情况地图。

约翰·霍普金斯大学的新冠疫情图已经超过了丁香园的展示范围。


从这天起,从学习、到超越”被再现。


🔺我们公众号于2020年1月21日采用的丁香园疫情地图。丁香园只做了中国疫情图,而忽视了海外疫情图。就在这一天,约翰·霍普金斯大学的新冠疫情图,以丁香园数据为基础发布。截图来源:Hanson临床科研公众号。


随着病毒的扩散,科学家们手动梳理了非常规的信息来源--例如媒体渠道和公共卫生官员的推特帖子。

但随着疫情爆发成大流行病,手动搜索数据变得不可持续。Gardner 在系统科学与工程中心的研究小组和她在约翰·霍普金斯大学应用物理实验室领导的另一个小组编写了计算机程序,以自动从每个来源“抓取”数据
这是一项了不起的壮举。

他们还开发了异常检测软件,可以标记可疑的数据变化,并在团队调查这些突然的偏差是否真实时保留这些数据。Gardner 的团队审查每条有问题的数据,找出突然飙升或下降的原因。只有在验证它之后,他们才会在 GitHub 中发布它,它会提供地图。

通过这种质量控制机制,最多程度控制了错误信息被传播到仪表板。


三阶段
信息的传播

(Information epidemic)


约翰·霍普金斯大学的新冠数据库已经成为全球最可靠的新冠信息来源。
尽管许多机构、市政当局和国家建立了自己的新冠数据库,但 Gardner 的空间分辨率在大型数据聚合器中是无与伦比的。它仍然是大流行病的流行病学记录的金标准,并将继续发挥重要作用,因为人们回顾性研究 Covid-19 并制定公共卫生数据收集、监测和显示的方法。

通过她富有远见的工作, Gardner 构想并推出了一个开创性的数据库,使世界第一次能够观察大流行病的发展过程,她将未来的健康危机与这一基准挂钩。


小结:

及时、准确和可获取的信息,对于制定灵活合理的策略来对抗迅速蔓延的疫情至关重要。
通过提供对新冠疫情最快速而准确的信息传递,美国约翰·霍普金斯大学的Lauren Gardner团队创建的新冠数据库使公众、媒体、政策制定者、企业和学者能够跟踪新冠病毒的传播,做出明智的决定以降低风险。

除此之外,我们更应该记住董恩生(Ensheng Dong)这个名字。
他对祖国疫情的关切,是创建这个网站的创意来源。

(Ensheng Dong)


董恩生更是充分运用自己的知识,一起改写了流行病监测的方式。

(董恩生的研究被引用次数接近1万次,即达到Top级学者之列)


在完成对整个故事的回顾后,我们更想请教朋友们三个问题。
(下面的观点仅为抛砖引玉用)

1,初创者如何笑到最后?

率先做,就能笑到最后吗?
很难。初创者的个人能力和意愿将是做大的最大制约。因为想到一件事很容易,做成不易、想做到最强则极难。

看看Lauren Gardner怎么做到的。创意来自于学生、技术来自于学生,面对这种情况,Lauren Gardner
1),全力支持核心干将。
2),最重要的是把握住了宣传出口。第一时间在推特上宣布“我们做到了!”。
3),根据需要招募和创建新团队,将自己置于领导者的位置。
4),继续坚持做最重要的事情:推广、推广、推广。

Lauren Gardner坚持做:招人做强业务、自己全力推广。

(推广:Gardner与科学记者讨论她的仪表板。图源:Lasker Award)


2,个人如何避免被挤出核心圈?


说实话,我们很为董恩生鸣不平。

创意是董恩生的、最初的构建是董恩生的。但是不仅奖项与他无关,搜索美国媒体,对于他的报告很罕见。

要知道,很多诺贝尔奖会同时奖励导师及其学生。


不知具体情况,我们不做太多评价。

只是想说一下美国朋友圈讨论最多的:为什么技术最好的中国人总干最苦最累的活、而印度人却占据了美国最大公司的大部分CEO位置?


我的观点是:个人意愿决定了大结局。

或者说文雅点:初心,决定了结局

举个自己碰到的例子。
刚来美国时在实验室工作。我是最勤奋的,出的研究结果和论文也最多。与比我早来2个月的印度人在一个房间办公,她的工作量不到我的1/3,但是她每天都会去老板娘那里沟通。
两年后,我成了实验室干活的主力,一遇到难做的实验,我成了第一接盘侠啃硬骨头身心疲惫;而她,成了大半个lab manager。

再举一个我儿子给我的抱怨。
他在小学二年级时的team一共三个人,另外两个分别是印度孩子和美国孩子。儿子回来给我抱怨,说他相当team leader,却总是印度孩子做。“可是他什么都不干!”。
美国孩子只沉浸于做事、不想当组长;我儿子既做事、还想到组长;那个印度孩子几乎不做事,但是挨个沟通,还经常跑到别的组及找老师沟通。结果老师感觉成绩都是印度孩子的。

最后举一个我和孩子们一起遇到的事情。
今年暑假去海边度假,我带两个孩子在海边筑长城,为此特意买了铲子。长城建得很雄伟,很多路过的人拍照。
这时,跑过来两个印度孩子,要求加入;然后就开始向来往的人及其父母展示“他们的工作”。
过程中,大些的印度孩子跟我要我正在用的铲子,我直接拒绝。然后他转向我儿子要用他正在用的小铲子,我儿子说等自己用完之后给他用。最后这个印度孩子转向我家四岁的女儿,借用她正在用的水桶;女儿爽快地给了他,然后自己无趣地看我们玩。
我没有干预,但当时在想,如果我的孩子们看到别人的成功,他也想成功、会怎么做?他们几乎都会自己独立地、从头开始做类似的构建。而很明显,印度孩子则不仅直接接盘了别人的成果、还意图占走基本资源。

讲这三个故事,我只是想表述:我们在做事时、对自己的最终定位,决定了我们早期的行动方案,也直接决定了自己以后的位置
很多时候,我们努力做一个我们自认为勤奋、正直、善良的人,并不屑于争抢位置;但领导却会认为任劳任怨是你愿意做的、或者这就是你适合的位置;而其他人却利用你的退缩,而抢功上位。

我们无从知道董同学对自己在这个项目中的定位如何。
只是一个学生角色?还是项目的管理者、甚至一个未来公司的创建者?
这个定位决定了他继续闷头做挖掘,还是借助这个项目推广自己、及提升自己的管理能力。

3,丁香园为什么没有做出约翰·霍普金斯大学新冠数据库?

作为丁香园骨灰级战友,这是我感到最惋惜的事情。

丁香园的新冠病例报告板创建的最早,董同学最初用的数据也全来自于丁香园;结果却是:丁香园在这个改写了公卫流行病监测方式的“新冠动态报告板发展”史,只存在于一句描述的话语中。


而对比本文中同样展示2020年1月21日新冠疫情的DXY图和CSSE图,你会发现:尽管来源于丁香园的数据,尽管约翰·霍普金斯大学CSSE图还是只展示亚洲(当时美国已经有了病例),但从那时起,疫情报告就不被局限于仅展示中国的疫情。

初心,即决定了大结局。


参考资料来源:
【1】 https://laskerfoundation.org/winners/noninvasive-prenatal-testing-using-fetal-dna/
【2】 https://www.nytimes.com/2022/09/28/health/lasker-award-medical-research.html

更多大数据分析报告及临床科研分享,在本公众号主页面下回复“临床科研”、“选刊”、“选题”、“模板”、“基金”、“绿卡”、“润色”、“人物”、“新冠”等均可以获得对应资料。并支持按照科室搜索,如回复“消化科”,即获得该专题的资料。


更多精彩人生,在公众号主页面下回复“人物”。



编辑:Henry,微信号:Healsan。

Hanson临床科研团队,由6位在美国的医生及医学科学家组成;目前在美国主要从事新药研发和临床科研。


点击👆,让科研和SCI论文成为临床工作的副产品

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
头顶的星星是思念的方向澳洲取消每日新冠数据报告,这周起变“周更”!新增疫情趋势分析!毛泽东写了8个字,周恩来为他送灵!他散尽家财,一生创办118所学校!哪个国家的留学生最内卷?中国留学生质疑:难道我们真的比印度留学生差吗?揭秘!新西兰留学生作弊黑幕曝光!非洲代写:“给中国留学生写了很多…”严重可坐牢,千万别碰!中国留学生成“常客”,中国代写公司遭大扒皮!包办入学到毕业所有论文,已形成庞大“产业链”!澳高校严查,上百名学生被挂科、开除!2022“诺奖风向标”拉斯克奖揭晓,“无创产检之父”卢煜明获奖|环球科学要闻佩洛西访台飞机起飞了!美中台准备好了吗?《星汉灿烂》:我们可以从少商身上学到什么?恐怖首尔,中国留学生踩在凳子上脱险!危险中,我们能做什么自救?卢煜明因无创检测获拉斯克奖,距离诺奖还远吗?金融交易能从竞技体育里学到什么?|巴伦读书会潘建伟导师获诺贝尔物理学奖,致辞提及4篇论文都有中国科学家参与数据库“焕然新生”:架构视角下,云原生数据库的创新实践 | Q推荐他获得“搞笑诺贝尔奖”10年后,摘得了诺贝尔物理学奖温哥华秋季新店合集 | 超美甜品、咖啡、创意、炸鸡&烧腊, 全在这了!没有自己的数据怎么发SCI?用好这些公共数据库和数据缺失处理方法,发表SCI并不难!铁道走廊的故事青梅物语让AI小队混战跑毒经商,还设“坦克奖”,NeurIPS这比赛真不是打游戏?​独家专访潘建伟:导师获奖实至名归,中国量子研究居于世界第一方阵“飞豹”战机前舱无女飞?她改写了历史!如果不幸入狱,你能学到什么?潘建伟导师获诺贝尔物理学奖!致辞提及4篇论文都有中国科学家参与这届天猫双11有点不一样,没有了GMV,多了暖意、善意、绿意复盘海外潮玩龙头,本土品牌从中能学到什么?一个人的徒步,900公里法国之路+世界尽头:D22~夜逃 & 惜别被LV青睐的草间弥生!顶尖艺术大温也能学到!学生创作更牛!剧变当下,我们能从漫长的20世纪学到什么?| 书评如果俄乌战争是面镜子,你能从中看到什么?量化研究入行1年能学到什么?绿卡成功案例 – 转行软件工程师获得 NIW 批准这片指尖大小的骨头碎片,改写了人类的起源被中国学者忽视的“整合素”研究,刚获“拉斯克奖”。怎么追这个热点?「简报」Skarlatos 获得 Meta 研究奖以改进数据中心计算系统;Donahue 获得 ACS 创意研究奖
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。