e*6
2 楼
目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
非常低,基本等同瞎猜。
有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
组合?
测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
非常低,基本等同瞎猜。
有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
组合?
d*m
3 楼
GWAS外行,不是很看得懂问题,我个人的理解是sample size很小但分析目标很多?如
果是
这样,有点类似curse of dimensionality,多找找类似问题的解决方法呗,反正不会
容易。你这个
问题最好自己建模,从头回答。我试着提供个一个可能的大概思路,把这些snp当作
mixture of
density处理,看看能不能找出centers,然后parametric or non-parametric就看你自
己的选择了。
果是
这样,有点类似curse of dimensionality,多找找类似问题的解决方法呗,反正不会
容易。你这个
问题最好自己建模,从头回答。我试着提供个一个可能的大概思路,把这些snp当作
mixture of
density处理,看看能不能找出centers,然后parametric or non-parametric就看你自
己的选择了。
d*m
4 楼
哦对了,忘说了,有了snp的density model,就可以考虑Bayesian analysis来归纳疾
病的
probability了。
病的
probability了。
d*m
5 楼
样本太小的话要么砸钱把样本弄大,要么bootstrap,model-based和resampling都试试。
不好意思,这么零散,大半夜的也是想到什么说什么。
不好意思,这么零散,大半夜的也是想到什么说什么。
d*m
6 楼
卧槽,大半夜这个问题看的我手痒,如果我自己是pi的话真的想和楼主合作一下
f*n
7 楼
首先,训练样本几十个?????那么这个问题就over了。
现在的GWAS,都是几千个的
第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
这种研究,就是现代版的算命
GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及
【在 e*********6 的大作中提到】
: 目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
: 测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
: 非常低,基本等同瞎猜。
: 有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
: 以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
: 一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
: 组合?
现在的GWAS,都是几千个的
第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
这种研究,就是现代版的算命
GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及
【在 e*********6 的大作中提到】
: 目前有一种遗传相关疾病,有大概一半病人对治疗没反应,却天天打针很痛苦,目前有
: 测得的SNP,每个病人有几万个信号,但是训练样本只有几十个,prediction的准确度
: 非常低,基本等同瞎猜。
: 有什么办法能通过SNP数据,对病人预后进行预测?如能能带到很高准确率,这样就可
: 以提前判断出哪类病人对治疗无效,就不用让人天天额外受苦了。
: 一个具体问题,GWAS测得SNP有没有local motif?就是语言上的这种单词的高频的固定
: 组合?
s*s
9 楼
我觉得没法重复不一定是artifact。
打个比方,有100个SNP和这个phenotype有关,每次做GWAS只能找到10个,
那么两次之间 就没啥交集,也就是难以重复了,但是其实都是真的信号,power不够而
已。
企及
【在 f*****n 的大作中提到】
: 首先,训练样本几十个?????那么这个问题就over了。
: 现在的GWAS,都是几千个的
: 第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
: 明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
: 第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
: 这种研究,就是现代版的算命
: GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
: 个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
: rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及
打个比方,有100个SNP和这个phenotype有关,每次做GWAS只能找到10个,
那么两次之间 就没啥交集,也就是难以重复了,但是其实都是真的信号,power不够而
已。
企及
【在 f*****n 的大作中提到】
: 首先,训练样本几十个?????那么这个问题就over了。
: 现在的GWAS,都是几千个的
: 第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
: 明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
: 第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
: 这种研究,就是现代版的算命
: GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
: 个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
: rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及
e*6
10 楼
这个找思路,还是要从数据本身,labeled的sample只有几十个,但是公共数据库还有
很多,还是要用deep learning里边的技术
【在 d********m 的大作中提到】
: GWAS外行,不是很看得懂问题,我个人的理解是sample size很小但分析目标很多?如
: 果是
: 这样,有点类似curse of dimensionality,多找找类似问题的解决方法呗,反正不会
: 容易。你这个
: 问题最好自己建模,从头回答。我试着提供个一个可能的大概思路,把这些snp当作
: mixture of
: density处理,看看能不能找出centers,然后parametric or non-parametric就看你自
: 己的选择了。
很多,还是要用deep learning里边的技术
【在 d********m 的大作中提到】
: GWAS外行,不是很看得懂问题,我个人的理解是sample size很小但分析目标很多?如
: 果是
: 这样,有点类似curse of dimensionality,多找找类似问题的解决方法呗,反正不会
: 容易。你这个
: 问题最好自己建模,从头回答。我试着提供个一个可能的大概思路,把这些snp当作
: mixture of
: density处理,看看能不能找出centers,然后parametric or non-parametric就看你自
: 己的选择了。
e*6
11 楼
如果问题不over,都想ImageNet那种有几万个labeled的sample,别人早就做出来了,
轮不到我们在这里讨论了。
企及
【在 f*****n 的大作中提到】
: 首先,训练样本几十个?????那么这个问题就over了。
: 现在的GWAS,都是几千个的
: 第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
: 明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
: 第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
: 这种研究,就是现代版的算命
: GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
: 个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
: rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及
轮不到我们在这里讨论了。
企及
【在 f*****n 的大作中提到】
: 首先,训练样本几十个?????那么这个问题就over了。
: 现在的GWAS,都是几千个的
: 第二,GWAS主要的对象是common variants;我个人的观点是,部分common variants有
: 明确的功能,比如对promoter的影响,但影响甚微,比如2-fold差别对于基因表达
: 第三,就算你 有几千个样本,每个样本几万个SNP, 最后依然不会对治病有啥帮助。
: 这种研究,就是现代版的算命
: GWAS难以重复,大量artifact,计算得到重要SNP,功能研究也是头疼。
: 个人认为,遗传学的金标准,依然是family linkage study的那些有重大致病作用的
: rare mutation。至于GWAS/common variants这一套,我们目前的人类文明水平难以企及
C*n
12 楼
GWAS 的用途和可利用度绝对被夸大了。只能当玩具玩玩,不能倾入太大资源。
e*6
13 楼
关键现在是不知道gwas到底没用,还是分析手段有限,没有利用价值。参考页岩油。
:GWAS 的用途和可利用度绝对被夸大了。只能当玩具玩玩,不能倾入太大资源。
:GWAS 的用途和可利用度绝对被夸大了。只能当玩具玩玩,不能倾入太大资源。
相关阅读
依托A单位申请青千,拿到后可以去B单位吗求助:nuclear/mitochondrial fractionation 的kit或者经验证有效的 protocol还是不淡定生物女博士后,37岁,该往哪转,日子能过的好点?寻2014 SFN 合租室友有没有能够读文献的软件列推荐人怎么描述二老板skew Th17 from Human PBMC?ask for a paper谢晓亮和林志玲被点名了请教药企面试的问题,求建议,先谢~文章被拒(Circulation Research),求建议中山大学Faculty招聘请问谁有分离小鼠肝cell membrane的protocol吗?干细胞裤。。。Anyone know about "Editorial Board Job"? (转载)大家来谈谈蛋白质的热点吧yeast污染Nature质疑microbiome 研究中国农大院士贪污挪用公款的事儿上新浪了