avatar
e*6
2
目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
非常低,基本等同瞎猜。
有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
组合?
avatar
d*m
3
GWAS外行,不是很看得懂问题,我个人的理解是sample size很小但分析目标很多?如
果是
这样,有点类似curse of dimensionality,多找找类似问题的解决方法呗,反正不会
容易。你这个
问题最好自己建模,从头回答。我试着提供个一个可能的大概思路,把这些snp当作
mixture of
density处理,看看能不能找出centers,然后parametric or non-parametric就看你自
己的选择了。
avatar
d*m
4
哦对了,忘说了,有了snp的density model,就可以考虑Bayesian analysis来归纳疾
病的
probability了。
avatar
d*m
5
样本太小的话要么砸钱把样本弄大,要么bootstrap,model-based和resampling都试试。
不好意思,这么零散,大半夜的也是想到什么说什么。
avatar
d*m
6
卧槽,大半夜这个问题看的我手痒,如果我自己是pi的话真的想和楼主合作一下
avatar
f*n
7
首先,训练样本几十个?????那么这个问题就over了。
现在的GWAS,都是几千个的
第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
这种研究,就是现代版的算命
GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及

【在 e*********6 的大作中提到】
: 目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
: 测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
: 非常低,基本等同瞎猜。
: 有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
: 以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
: 一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
: 组合?

avatar
s*s
8
几十个病人?死马当活马医,试试看说不定有信号呢。

【在 e*********6 的大作中提到】
: 目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
: 测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
: 非常低,基本等同瞎猜。
: 有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
: 以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
: 一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
: 组合?

avatar
s*s
9
我觉得没法重复不一定是artifact。
打个比方,有100个SNP和这个phenotype有关,每次做GWAS只能找到10个,
那么两次之间 就没啥交集,也就是难以重复了,但是其实都是真的信号,power不够而
已。

企及

【在 f*****n 的大作中提到】
: 首先,训练样本几十个?????那么这个问题就over了。
: 现在的GWAS,都是几千个的
: 第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
: 明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
: 第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
: 这种研究,就是现代版的算命
: GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
: 个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
: rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及

avatar
e*6
10
这个找思路,还是要从数据本身,labeled的sample只有几十个,但是公共数据库还有
很多,还是要用deep learning里边的技术

【在 d********m 的大作中提到】
: GWAS外行,不是很看得懂问题,我个人的理解是sample size很小但分析目标很多?如
: 果是
: 这样,有点类似curse of dimensionality,多找找类似问题的解决方法呗,反正不会
: 容易。你这个
: 问题最好自己建模,从头回答。我试着提供个一个可能的大概思路,把这些snp当作
: mixture of
: density处理,看看能不能找出centers,然后parametric or non-parametric就看你自
: 己的选择了。

avatar
e*6
11
如果问题不over,都想ImageNet那种有几万个labeled的sample,别人早就做出来了,
轮不到我们在这里讨论了。

企及

【在 f*****n 的大作中提到】
: 首先,训练样本几十个?????那么这个问题就over了。
: 现在的GWAS,都是几千个的
: 第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
: 明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
: 第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
: 这种研究,就是现代版的算命
: GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
: 个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
: rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及

avatar
C*n
12
GWAS 的用途和可利用度绝对被夸大了。只能当玩具玩玩,不能倾入太大资源。
avatar
e*6
13
关键现在是不知道gwas到底没用,还是分析手段有限,没有利用价值。参考页岩油。

:GWAS 的用途和可利用度绝对被夸大了。只能当玩具玩玩,不能倾入太大资源。
avatar
s*x
14
你确定是GWAS? 几十个样本的话应该是WGS或WES。

【在 e*********6 的大作中提到】
: 目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
: 测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
: 非常低,基本等同瞎猜。
: 有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
: 以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
: 一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
: 组合?

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。