请教个bioinformatics的问题 - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>Biology - 生物学

请教个bioinformatics的问题

请教个bioinformatics的问题# Biology - 生物学

k*y2016-11-20 08:11

1 楼

好急哦，俺的id里就有4个keys啊；
先谢了。。。

e*62016-11-20 08:11

2 楼

在bioinformatics里边，各种做prediction是个热门话题，但是有个问题始终搞不明白
比如看这篇文章，http://www.nature.com/articles/srep28517
他的方法以及他对比的方法，都有1%的false positive，这在同类研究中已经算是非常
好的成果了, 画个ROC算个AUC都很好看，但
是有个问题很不解，因为在整个基因组上，想要的interesting points（这里是
promoter）是非常非常稀疏的，也就几万个，人体基因组有3 billion bp，就算100个
bp一个间隔来创造备选的样品（长度200bp来算只有50% overlap了），这就有30
million个samples，就算百分之一的false positive，那就有30万个false positive，
已经是true positive的好多倍了，这种问题如何在进一步解决呢？
并且，类似这种paper，包括发在非常decent，high-impact的journal上的（包括plos
系列，BMC系列，包括这篇是nature系列的），都没提到过如何解决这个问题？

f*82016-11-20 08:11

3 楼

手写添上

【在 k********y 的大作中提到】

: 好急哦，俺的id里就有4个keys啊；
: 先谢了。。。

I*r2016-11-20 08:11

4 楼

你说的是文章中的accuracy 吗？

M*n2016-11-20 08:11

5 楼

治标的办法是把软键盘调出来，用mouse点就可以了
治本的方法就是去网上买一个对应你笔记本的键盘，换上就可以了，简单的很，就是要折机器先。

【在 k********y 的大作中提到】

: 好急哦，俺的id里就有4个keys啊；
: 先谢了。。。

e*62016-11-20 08:11

6 楼

差不多吧，不过他的accuracy没细看啥意思，但是应该false positive和false
negative都是百分之一左右

【在 I**********r 的大作中提到】

: 你说的是文章中的accuracy 吗？

k*y2016-11-20 08:11

7 楼

谢了，啊，俺不懂怎样拆呀；
现在都用copy和pas e 了
这样也好，可以少灌点水了。。。赫赫。。。

要折机器先。

【在 M****n 的大作中提到】

: 治标的办法是把软键盘调出来，用mouse点就可以了
: 治本的方法就是去网上买一个对应你笔记本的键盘，换上就可以了，简单的很，就是要折机器先。

n*g2016-11-20 08:11

8 楼

decent? Scientific Report is a trash journal.
Even Nature is trash

plos

【在 e*********6 的大作中提到】

: 在bioinformatics里边，各种做prediction是个热门话题，但是有个问题始终搞不明白
: 比如看这篇文章，http://www.nature.com/articles/srep28517
: 他的方法以及他对比的方法，都有1%的false positive，这在同类研究中已经算是非常
: 好的成果了, 画个ROC算个AUC都很好看，但
: 是有个问题很不解，因为在整个基因组上，想要的interesting points（这里是
: promoter）是非常非常稀疏的，也就几万个，人体基因组有3 billion bp，就算100个
: bp一个间隔来创造备选的样品（长度200bp来算只有50% overlap了），这就有30
: million个samples，就算百分之一的false positive，那就有30万个false positive，
: 已经是true positive的好多倍了，这种问题如何在进一步解决呢？
: 并且，类似这种paper，包括发在非常decent，high-impact的journal上的（包括plos

e*e2016-11-20 08:11

9 楼

可以从网上搜一个词含有这个字，每次都拷贝进去：）

s*c2016-11-20 08:11

10 楼

1% false negative?
On average, PEDLA achieved 95.0% accuracy, a 96.8% GM (99.0% sensitivity and
94.6% specificity) and a 78.7% F1-score (99.0% recall and 65.4% precision)
99% sensitivity or recall means FN is 1% of the TP.
65% precision means FP is 50% of TP. not 好多倍
94.6% specificity means FP is 5.7% of TN.
TP:TN ~ 1:10
plos

【在 e*********6 的大作中提到】

d*i2016-11-20 08:11

11 楼

pull off the cap and put it back on first to make sure it's really broken

【在 k********y 的大作中提到】

: 好急哦，俺的id里就有4个keys啊；
: 先谢了。。。

e*62016-11-20 08:11

12 楼

问题就在这里，他抽样了是tp比tn一比十，从方法上说没问题，但现实应用起来，实际
是一比一百万

and

【在 s*****c 的大作中提到】

:
: 1% false negative?
: On average, PEDLA achieved 95.0% accuracy, a 96.8% GM (99.0% sensitivity and
: 94.6% specificity) and a 78.7% F1-score (99.0% recall and 65.4% precision)
: 99% sensitivity or recall means FN is 1% of the TP.
: 65% precision means FP is 50% of TP. not 好多倍
: 94.6% specificity means FP is 5.7% of TN.
: TP:TN ~ 1:10
: plos

M*n2016-11-20 08:11

13 楼

学学嘛，比折一个闹钟复杂不了多少。就是拧几个螺丝的事
去网上找找有没有相应的视频或是图文并茂的文档
按图来，很快的。
不然，你去买个USB的desktop keyboard好了，插上就能用，应急呗

【在 k********y 的大作中提到】

: 谢了，啊，俺不懂怎样拆呀；
: 现在都用copy和pas e 了
: 这样也好，可以少灌点水了。。。赫赫。。。
:
: 要折机器先。

r*62016-11-20 08:11

14 楼

[在 nostring (尼) 的大作中提到：]
:decent? Scientific Report is a trash journal.
:Even Nature is trash
:plos
老兄火气很很大啊哈哈哈哈哈

k*y2016-11-20 08:11

15 楼

谢谢楼上个位让俺来试试

c*32016-11-20 08:11

16 楼

Scientific reports 上面的生物信息的文章，我建议你不要看。
大部分水平都不行，但得质量可以，都会发表在，genome biology， plos CB 或者
bioinformatics上面了

问题就在这里，他抽样了是tp比tn一比十，从方法上说没问题，但现实应用起来，实际

【在 e*********6 的大作中提到】

: 问题就在这里，他抽样了是tp比tn一比十，从方法上说没问题，但现实应用起来，实际
: 是一比一百万
:
: and