Redian新闻
>
利用这个开放的数据库已经发了2万多篇SCI,最近2年76%文章由中国学者发表

利用这个开放的数据库已经发了2万多篇SCI,最近2年76%文章由中国学者发表

科学

让科研和SCI论文成为临床工作的副产品。


关键词:数据库;ChatGPT;Q&A-33

经常有朋友问:
如何利用网络开放的资源发SCI论文?

不外乎meta分析、临床试验设计、及我们帮助了很多朋友的文献计量学。
除此之外,还有很多朋友利用国内外开放的数据库发表了很多论文,今天就对应用最为广泛的The Cancer Genome Atlas (TCGA)数据库做一解析。

The Cancer Genome Atlas (TCGA)是提供多种癌症类型的基因组、转录组和临床数据,可用于癌症的分子分类、生物标志物鉴定、疗效预测等临床研究。网址:

https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga


如前,还是先由ChatGPT解答。


要利用Cancer Genome Atlas (TCGA)数据库做自己的临床研究,通常需要进行以下几个步骤:


1,确定研究问题:

首先需要明确自己的研究问题,例如想要研究某种癌症的分子机制、生物标志物、疗效预测等。根据研究问题的不同,可以选择不同的癌症类型、分子数据和临床数据。


2,访问TCGA数据库:

可以通过TCGA官方网站访问数据库,注册账户并登录后即可下载数据。需要注意的是,TCGA数据库的数据量庞大,需要具备基本的生物信息学分析技能和计算机编程能力。


3,数据预处理:

从TCGA下载的数据需要进行预处理和清洗,包括基因表达量归一化、差异基因分析、生存分析等。这通常需要使用一些生物信息学分析工具和软件,如R、Bioconductor、Python等。


4,数据分析和解释:

根据研究问题的需要,可以选择不同的数据分析方法和统计学技术,如聚类分析、基因组关联分析、机器学习等。需要根据分析结果来解释研究问题的相关机制、预测疗效等。


5,结果呈现和发表:

最后需要将研究结果进行可视化呈现,如绘制图表、生成报告等。如果研究结果有价值,可以撰写科学论文并发表在相关领域的学术期刊上。


总之,利用TCGA数据库进行临床研究需要具备一定的生物信息学和统计学分析能力,需要深入理解癌症的分子机制和临床表现,以及掌握常用的数据分析方法和工具。此外,需要遵守相关的法律法规和研究伦理原则,保护病人的隐私和数据安全。


对TCGA数据库使用的大数据分析


有了使用概况,就需要找到一个切实可行的执行方法。读之前利用TCGA发表的论文无疑是最便捷的途径。

我们用文献鸟做了初步的分析。


从2021年到现在,就发表了9822篇论文,其中76%由中国学者发表。

(可视化作图:文献鸟)


这些论文发表最多的期刊是四个Frontiers期刊,然后是Sci Rep

但也有论文发表在了J Immunother Cancer期刊。

(可视化作图:文献鸟


举例:

下面这篇就是充分利用深度学习技术,研究开放数据库病例的论文

Schneider L, et al. Multimodal integration of image, epigenetic and clinical data to predict BRAF mutation status in melanoma. Eur J Cancer. 2023 Feb 4;183:131-138. doi: 10.1016/j.ejca.2023.01.021. Epub ahead of print. PMID: 36854237.


如果用TCGA数据库样本做筛选,自己的样本做验证,再加上免疫组化或流式,则可以讲一个更完整的故事。

Peng QH, et al. CMTM6 and PD-L1 coexpression is associated with an active immune microenvironment and a favorable prognosis in colorectal cancer. J Immunother Cancer. 2021 Feb;9(2):e001638. doi: 10.1136/jitc-2020-001638. PMID: 33579737; PMCID: PMC7883863.


如果想往更深做,且有非常好的发现;可以借鉴这篇论文,非常棒。

Ye Y, Dai Q, Qi H. A novel defined pyroptosis-related gene signature for predicting the prognosis of ovarian cancer. Cell Death Discov. 2021 Apr 7;7(1):71. doi: 10.1038/s41420-021-00451-x. PMID: 33828074; PMCID: PMC8026591.


这篇也非常经典,可以借鉴。

McGrail DJ, et al. High tumor mutation burden fails to predict immune checkpoint blockade response across all cancer types. Ann Oncol. 2021 May;32(5):661-672. doi: 10.1016/j.annonc.2021.02.006. Epub 2021 Mar 15. PMID: 33736924; PMCID: PMC8053682.


最后,

您想问ChatGPT什么问题?发给我们

欢迎后台留言提问。

参考资料来源:

https://chat.openai.com/chat



编辑:Henry,微信号:Healsan助理:ChatGPT
封面图片制作:Healsan Consulting LLC©,委托OpenAI制作;原型:Jackson
分析机构:
Healsan Consulting,主要利用大数据分析,为人才中心、制药公司及医生提供医学和生物领域的文献计量学、数据挖掘、分析和咨询服务。6位专业分析师,熟悉生物医学数据库,擅长文献鸟(Stork)、CiteSpace、VOSviewer、R-bibliometrix等可视化工具,每年提供400余项分析。


点击👆,让SCI和基金成为临床工作的副产品!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
临床数据库对于临床科研有多重要?如何利用开放的数据库撰写SCI论文?ChatGPT-31:卒中领域的开放数据库。已有中国学者借助这些数据发表了自己的研究论文使用这个开源的会计应用来管理你的小企业 | Linux 中国多模数据库、“Serverless 化” | 开源数据库领域解读每分钟可处理8.14亿笔交易、腾讯云数据库TDSQL刷新TPC-C纪录对国产数据库行业意味着什么?靠白嫖数据库发表了人生第一篇10+SCI,这个套路简直封神!该杂志刚被踢出SCI,现在陆续撤回中国学者101篇文章救命!我还在找文献,上铺已经发了3分SCI!这个找文献节省70%时间!光速发SCI!某三甲医院医生连发多篇SCI直冲副高,这个方法真绝!(附文章框架)单基因泛癌也能发表纯生信?用这个思路搞定影响因子4.77分SCI不吹不黑!几周工作量10分钟搞定,用这个3个月发表6.16分生信SCI(附教程)她以第一作者发表SCI论文,连续四年获专业第一在一个开放的世界,自由地生存,等待黎明 | 谷雨博士生发表16篇SCI,一作总IF达114,填补领域空白!Andy教授解读数据库的2022:大规模数据库投资大幅放缓、区块链数据库仍然是一个愚蠢的想法《丑陋的中国人》帽子必须摘掉不盲从不掉队,我们找了20篇最值得读的数字化转型文章用这个开源工具在 React 中建立一个交互式时间轴 | Linux 中国在最美风景的阿尔卑斯高山公路自驾如何快速发表SCI?保姆级教程,1小时学会SCI写作、发表套路!婚后第一次出轨日本啊,日本(十八)和敬清寂的由来研究了2600多篇爆仓文学后,我好像搞懂人是怎么变赌狗的了盘点2022年的数据库/数据仓库/数据湖市场(下)——Teradata退出中国市场了,Oracle还没走。。。小女儿在玫瑰花车游行急救了一病人盘点2022年的数据库/数据仓库/数据湖市场(上)。。。“白嫖”公共数据,居然用GEO数据库完成自己的第一篇SCI最全的生物样本数据库(Biobank)收集;及部分公开数据库的大数据分享2022 年数据库发展总结:中国和海外数据库差距还有多远?【模板】利用开放数据库再发顶刊!找到“新冠发展到重症的预测指标”,孟德尔随机化设计起到关键作用“白嫖”公共数据,用GEO数据库完成自己的第一篇SCI存储量扩大千倍,Discord 是如何使用Rust语言和ScyllaDB数据库来改进架构的?发表10篇SCI论文,升学中科大!他说“我的很多成果都是最后一年才有的”模拟天然途径诱集害虫:英国学者利用烟草精准高效生产多种性信息素频发顶刊!利用数据库UK Biobank,中国学者也发了980篇SCI论文
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。