Redian新闻
>
epigenetic的哪方面数据最为可靠
avatar
epigenetic的哪方面数据最为可靠# Biology - 生物学
e*6
1
好多paper都在预测这预测那里,但是这个领域最难说的就是ground truth, 哪方面的
数据可以作为ground truth来讨论其他数据呢?我知道这个问题很宽泛,希望大家能不
吝赐教。
我个人现在理解,对基因表达来说,只有RNA的表达才能算是ground truth, histobe只
能算是"推测"基因表达对吧?enhancer和promoter之间的相互作用,现在主要还考猜对
吧?还有什么CTCF和三维结构,也是主要靠猜,没有广泛认可的ground truth对吧?
希望大家多多赐教
avatar
j*u
2
楼主一边advocate plus one一边在这里当伸手党。你既然只想发plus one那也不用搞
清楚ground truth拉,胡扯也能发
avatar
l*e
3
Genome wide epigenetics 基本是扯。最明显的就是enhancer的histone mark, 靠这个
预测出来的enhancer至少有一半是无法验证的。至于3C 4C hiC, 就基本是胡扯了。
avatar
e*6
4
谢谢建议,想问的就是这个验证,是靠什么验证?这就是我很困惑的问题,通过各种预
测只是给未来提供一个可能性,但是确认要看什么数据可以作为ground truth

【在 l********e 的大作中提到】
: Genome wide epigenetics 基本是扯。最明显的就是enhancer的histone mark, 靠这个
: 预测出来的enhancer至少有一半是无法验证的。至于3C 4C hiC, 就基本是胡扯了。

avatar
e*6
5
这真不是伸手党,我看过很多文献,但文献里肯定打太极居多,哪种指标支持自己的结
论哪种就是正确的呗。
至于plos one, 个人觉得的确是个趋势,尤其是这种跨学科的,还是个很好的选择

【在 j*******u 的大作中提到】
: 楼主一边advocate plus one一边在这里当伸手党。你既然只想发plus one那也不用搞
: 清楚ground truth拉,胡扯也能发

avatar
l*e
6
经典的验证方法无非是
1) 用这个enhancer drive reporter gene expression看在不在target tissue, 有没
有和endogenous expression partially overlap.
2) knockout enhancer看有没有影响endogenous gene expression


: 谢谢建议,想问的就是这个验证,是靠什么验证?这就是我很困惑的问题,通过
各种预

: 测只是给未来提供一个可能性,但是确认要看什么数据可以作为ground truth



【在 e*********6 的大作中提到】
: 这真不是伸手党,我看过很多文献,但文献里肯定打太极居多,哪种指标支持自己的结
: 论哪种就是正确的呗。
: 至于plos one, 个人觉得的确是个趋势,尤其是这种跨学科的,还是个很好的选择

avatar
e*6
7
谢谢,这种方法毕竟没法大规模来。
不同细胞系上测RNA-seq,看看某个基因有没有对应的RNA-seq可以当成这个基因是否表
达的一个决定性证据吗?

【在 l********e 的大作中提到】
: 经典的验证方法无非是
: 1) 用这个enhancer drive reporter gene expression看在不在target tissue, 有没
: 有和endogenous expression partially overlap.
: 2) knockout enhancer看有没有影响endogenous gene expression
:
:
: 谢谢建议,想问的就是这个验证,是靠什么验证?这就是我很困惑的问题,通过
: 各种预
:
: 测只是给未来提供一个可能性,但是确认要看什么数据可以作为ground truth
:

avatar
l*e
8
对于比较严谨的研究者来说,如果能提供多条细胞系(3 case 3 control)的数据,可
以作为比较弱的证据。
如果只是忽悠一下reviewer的话,就随意了。


: 谢谢,这种方法毕竟没法大规模来。

: 不同细胞系上测RNA-seq,看看某个基因有没有对应的RNA-seq可以当成这个基因
是否表

: 达的一个决定性证据吗?



【在 e*********6 的大作中提到】
: 谢谢,这种方法毕竟没法大规模来。
: 不同细胞系上测RNA-seq,看看某个基因有没有对应的RNA-seq可以当成这个基因是否表
: 达的一个决定性证据吗?

avatar
e*6
9
补充一下问题,比如在图片识别领域,大部分情况下,人工识别的结果就可以当成一个
ground truth的数据,各种prediction,就可以拿人工识别的结果测准确率。在
epigenetic领域,比如基因表达,histone modification,promoter enhancer都不能
被当成这种ground truth,是不是RNA-seq的结果可以被当成ground truth?
作为ground truth的结果,还不能太少,纯实验的结果样本太少,所以我现在才很疑惑
这个问题。不然用一个不可靠的东西预测另一个不可靠的东西,这不太靠谱

【在 l********e 的大作中提到】
: 对于比较严谨的研究者来说,如果能提供多条细胞系(3 case 3 control)的数据,可
: 以作为比较弱的证据。
: 如果只是忽悠一下reviewer的话,就随意了。
:
:
: 谢谢,这种方法毕竟没法大规模来。
:
: 不同细胞系上测RNA-seq,看看某个基因有没有对应的RNA-seq可以当成这个基因
: 是否表
:
: 达的一个决定性证据吗?
:

avatar
l*e
10
从这个意义上说,是的,RNA-seq 可以作为ground truth.
当然比较抠门的人还会说RNA-seq signal不等于transcriptionally active ... 措辞
注意一下就行了


: 补充一下问题,比如在图片识别领域,大部分情况下,人工识别的结果就可以当
成一个

: ground truth的数据,各种prediction,就可以拿人工识别的结果测准确率。在

: epigenetic领域,比如基因表达,histone modification,promoter enhancer
都不能

: 被当成这种ground truth,是不是RNA-seq的结果可以被当成ground truth?

: 作为ground truth的结果,还不能太少,纯实验的结果样本太少,所以我现在才
很疑惑

: 这个问题。不然用一个不可靠的东西预测另一个不可靠的东西,这不太靠谱



【在 e*********6 的大作中提到】
: 补充一下问题,比如在图片识别领域,大部分情况下,人工识别的结果就可以当成一个
: ground truth的数据,各种prediction,就可以拿人工识别的结果测准确率。在
: epigenetic领域,比如基因表达,histone modification,promoter enhancer都不能
: 被当成这种ground truth,是不是RNA-seq的结果可以被当成ground truth?
: 作为ground truth的结果,还不能太少,纯实验的结果样本太少,所以我现在才很疑惑
: 这个问题。不然用一个不可靠的东西预测另一个不可靠的东西,这不太靠谱

avatar
e*6
11
好的,谢谢,除了RNAseq以外,还有啥类似的指标呢?

【在 l********e 的大作中提到】
: 从这个意义上说,是的,RNA-seq 可以作为ground truth.
: 当然比较抠门的人还会说RNA-seq signal不等于transcriptionally active ... 措辞
: 注意一下就行了
:
:
: 补充一下问题,比如在图片识别领域,大部分情况下,人工识别的结果就可以当
: 成一个
:
: ground truth的数据,各种prediction,就可以拿人工识别的结果测准确率。在
:
: epigenetic领域,比如基因表达,histone modification,promoter enhancer
: 都不能
:
: 被当成这种ground truth,是不是RNA-seq的结果可以被当成ground truth?

avatar
j*u
12
个人认为RNA Seq是最不靠谱的指标之一。实在是一言难尽
另外,用histon marker predict enhancer并不是那么糟糕,一半一半吧。最好还是要
结合transcription factor occupancy之类的指标作为证据。 怎么挑选enhancer,落
实到单个enhancer,还是需要一定经验的。

【在 e*********6 的大作中提到】
: 好的,谢谢,除了RNAseq以外,还有啥类似的指标呢?
avatar
j*u
13
3c 4c 结合histon marker和chromatin openning 预测enhancer是很准的
现在有一种误区,认为有genomewide approach,对于biological question的经验就不
重要了,这很不对。 genomewide approach也是需要对于biological question的经验
设置对照的。
个人认为genomewide 筛选就像早期的蛋白质纯化,要过一道又一道筛选,结合经验和
对想要的蛋白组分biological question的了解设置对照,最后拿到想要的fraction

【在 l********e 的大作中提到】
: Genome wide epigenetics 基本是扯。最明显的就是enhancer的histone mark, 靠这个
: 预测出来的enhancer至少有一半是无法验证的。至于3C 4C hiC, 就基本是胡扯了。

avatar
e*6
14
这不冲突啊,现在数据多,有足够经验搞biological question的少,肯定要先尽量用
机器自动预测。就好比银行用机器监控fraud,真要确认的时候,再用人工判定

【在 j*******u 的大作中提到】
: 3c 4c 结合histon marker和chromatin openning 预测enhancer是很准的
: 现在有一种误区,认为有genomewide approach,对于biological question的经验就不
: 重要了,这很不对。 genomewide approach也是需要对于biological question的经验
: 设置对照的。
: 个人认为genomewide 筛选就像早期的蛋白质纯化,要过一道又一道筛选,结合经验和
: 对想要的蛋白组分biological question的了解设置对照,最后拿到想要的fraction

avatar
e*6
15
预测enhancer很准,那怎么知道很准呢?如何判定一个地方真的是enhancer?

【在 j*******u 的大作中提到】
: 3c 4c 结合histon marker和chromatin openning 预测enhancer是很准的
: 现在有一种误区,认为有genomewide approach,对于biological question的经验就不
: 重要了,这很不对。 genomewide approach也是需要对于biological question的经验
: 设置对照的。
: 个人认为genomewide 筛选就像早期的蛋白质纯化,要过一道又一道筛选,结合经验和
: 对想要的蛋白组分biological question的了解设置对照,最后拿到想要的fraction

avatar
j*u
16
你去看看别的做你们machine learning的人的training dataset不就好了

【在 e*********6 的大作中提到】
: 预测enhancer很准,那怎么知道很准呢?如何判定一个地方真的是enhancer?
avatar
e*6
17
打太极的居多,别人用不代表就是ground truth 啊

【在 j*******u 的大作中提到】
: 你去看看别的做你们machine learning的人的training dataset不就好了
avatar
l*e
18
怎么不靠谱法 biological variation 大?


: 个人认为RNA Seq是最不靠谱的指标之一。实在是一言难尽

: 另外,用histon marker predict enhancer并不是那么糟糕,一半一半吧。最好
还是要

: 结合transcription factor occupancy之类的指标作为证据。 怎么挑选
enhancer,落

: 实到单个enhancer,还是需要一定经验的。



【在 j*******u 的大作中提到】
: 你去看看别的做你们machine learning的人的training dataset不就好了
avatar
l*e
19
很准是什么概念,预测了一个准了一个,还是预测了10个准了10个,还是预测了1000个
准了1000个?


: 3c 4c 结合histon marker和chromatin openning 预测enhancer是很准的

: 现在有一种误区,认为有genomewide approach,对于biological question的经
验就不

: 重要了,这很不对。 genomewide approach也是需要对于biological question
的经验

: 设置对照的。

: 个人认为genomewide 筛选就像早期的蛋白质纯化,要过一道又一道筛选,结合
经验和

: 对想要的蛋白组分biological question的了解设置对照,最后拿到想要的
fraction



【在 j*******u 的大作中提到】
: 你去看看别的做你们machine learning的人的training dataset不就好了
avatar
z*t
20
我觉得楼主是想讨论如何用非常reliable的数据进行机器学习的预测吧?

【在 e*********6 的大作中提到】
: 好多paper都在预测这预测那里,但是这个领域最难说的就是ground truth, 哪方面的
: 数据可以作为ground truth来讨论其他数据呢?我知道这个问题很宽泛,希望大家能不
: 吝赐教。
: 我个人现在理解,对基因表达来说,只有RNA的表达才能算是ground truth, histobe只
: 能算是"推测"基因表达对吧?enhancer和promoter之间的相互作用,现在主要还考猜对
: 吧?还有什么CTCF和三维结构,也是主要靠猜,没有广泛认可的ground truth对吧?
: 希望大家多多赐教

avatar
e*6
21
正是。

【在 z*t 的大作中提到】
: 我觉得楼主是想讨论如何用非常reliable的数据进行机器学习的预测吧?
avatar
z*t
22
其实有很多ground truce
比如DHS已经做了很长时间了,早期locus specific的data也做了很多,很多locus都有
很清晰的认识
但是这个是不是你想要的?

【在 e*********6 的大作中提到】
: 正是。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。