h*0
2 楼
现在用的phenom II x4 955,8G内存,显卡7850,导致玩游戏瓶颈全在CPU上了。
在newegg上看phenom II x6系列都停产了。
还有办法升级吗?
在newegg上看phenom II x6系列都停产了。
还有办法升级吗?
t*a
3 楼
一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
他们混淆了相关和因果。
既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
希望有朋友来回答,谢谢
类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
他们混淆了相关和因果。
既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
希望有朋友来回答,谢谢
z*e
5 楼
ebay 亚马逊都有,也不贵
a*p
6 楼
非常好的问题
it is a good question
希望有人出来解答
it is a good question
希望有人出来解答
p*a
7 楼
原件寄给律师,copy(不是复印件)寄给公司。
y*8
9 楼
It is very useful. The next generation of biologists almost have to know or
even master some bioinformatic tools. That is why people majored in
bioinformatics are relatively well-paid comparing to ones in other bio-
fields.
However, the vast majority of bioinformatics is based on statistics, which
by nature does not have predictive power. So, for the sake of biology, IMHO,
pure bioinfo would not lead to new discoveries.
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
even master some bioinformatic tools. That is why people majored in
bioinformatics are relatively well-paid comparing to ones in other bio-
fields.
However, the vast majority of bioinformatics is based on statistics, which
by nature does not have predictive power. So, for the sake of biology, IMHO,
pure bioinfo would not lead to new discoveries.
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
t*a
11 楼
谢谢回复。
However, the vast majority of bioinformatics is based on statistics, which
by nature does not have predictive power
这句话很有意思,我不太能理解。能请你展开说一说么?
or
IMHO,
【在 y******8 的大作中提到】
: It is very useful. The next generation of biologists almost have to know or
: even master some bioinformatic tools. That is why people majored in
: bioinformatics are relatively well-paid comparing to ones in other bio-
: fields.
: However, the vast majority of bioinformatics is based on statistics, which
: by nature does not have predictive power. So, for the sake of biology, IMHO,
: pure bioinfo would not lead to new discoveries.
:
: 文)
: contribution?
However, the vast majority of bioinformatics is based on statistics, which
by nature does not have predictive power
这句话很有意思,我不太能理解。能请你展开说一说么?
or
IMHO,
【在 y******8 的大作中提到】
: It is very useful. The next generation of biologists almost have to know or
: even master some bioinformatic tools. That is why people majored in
: bioinformatics are relatively well-paid comparing to ones in other bio-
: fields.
: However, the vast majority of bioinformatics is based on statistics, which
: by nature does not have predictive power. So, for the sake of biology, IMHO,
: pure bioinfo would not lead to new discoveries.
:
: 文)
: contribution?
e*o
13 楼
能找出因果当然好,因果太难,先把相关找出来再说。
s*a
17 楼
"因为他们混淆了相关和因果"
I would fail you if you were my student. E Segal used very different tools
in different subjects. In the examples of modeling yeast transcriptional
network, the regulators and targets were clearly spelled out and tested
experimentally.
I was watching a video of Francis Collins this morning. He said, if he were
to start from a graduate student, computational biology is the way to go.
Possibilities are endless. Check out recent papers from Atual Butte lab for
some translational examples.
I would fail you if you were my student. E Segal used very different tools
in different subjects. In the examples of modeling yeast transcriptional
network, the regulators and targets were clearly spelled out and tested
experimentally.
I was watching a video of Francis Collins this morning. He said, if he were
to start from a graduate student, computational biology is the way to go.
Possibilities are endless. Check out recent papers from Atual Butte lab for
some translational examples.
t*a
21 楼
呵呵,看来我还是蛮走运的,憋着negative的想法,没有被人干掉。
能请你具体解释一下very different tools in different subjects如何就可以从
microarray数据中推导出因果么?我指的是他在2003,2004年左右发表在nature上的
tumor network论文。
实验结果support论文逻辑,而逻辑又值得怀疑的论文很多,我真的不敢相信他们,我
怀疑有些不过是在编故事而已。
were
for
【在 s******a 的大作中提到】
: "因为他们混淆了相关和因果"
: I would fail you if you were my student. E Segal used very different tools
: in different subjects. In the examples of modeling yeast transcriptional
: network, the regulators and targets were clearly spelled out and tested
: experimentally.
: I was watching a video of Francis Collins this morning. He said, if he were
: to start from a graduate student, computational biology is the way to go.
: Possibilities are endless. Check out recent papers from Atual Butte lab for
: some translational examples.
能请你具体解释一下very different tools in different subjects如何就可以从
microarray数据中推导出因果么?我指的是他在2003,2004年左右发表在nature上的
tumor network论文。
实验结果support论文逻辑,而逻辑又值得怀疑的论文很多,我真的不敢相信他们,我
怀疑有些不过是在编故事而已。
were
for
【在 s******a 的大作中提到】
: "因为他们混淆了相关和因果"
: I would fail you if you were my student. E Segal used very different tools
: in different subjects. In the examples of modeling yeast transcriptional
: network, the regulators and targets were clearly spelled out and tested
: experimentally.
: I was watching a video of Francis Collins this morning. He said, if he were
: to start from a graduate student, computational biology is the way to go.
: Possibilities are endless. Check out recent papers from Atual Butte lab for
: some translational examples.
d*0
22 楼
主板CPU全换了算了
k*o
24 楼
现在用AMD家CPU纯属自找不自在
y*8
25 楼
The presumption of using statistics is that samples come from defined groups
. But statistics itself cannot define the group.
【在 t****a 的大作中提到】
: 谢谢回复。
: However, the vast majority of bioinformatics is based on statistics, which
: by nature does not have predictive power
: 这句话很有意思,我不太能理解。能请你展开说一说么?
:
: or
: IMHO,
. But statistics itself cannot define the group.
【在 t****a 的大作中提到】
: 谢谢回复。
: However, the vast majority of bioinformatics is based on statistics, which
: by nature does not have predictive power
: 这句话很有意思,我不太能理解。能请你展开说一说么?
:
: or
: IMHO,
D*r
27 楼
如果计算速度足够快,算法足够先进
数据来源或representation并不重要,只要量大、信息包含完整就成
你知道twitter的一个project怎么处理文本信息的吗
没有任何语言分析,甚至连词都不看,只看四个字母组成的序列
比如一条tweet是I am happy today.
那对应的feature就是I_am, _am_, ...happ,appy, ppy_....
最后根据这个,用统计方法居然能算出来语言包含的情绪
这对搞语言学分析的人是致命一击
因为只要数据在,就能算出几乎所有东西
当然,你得知道想要什么,这个还是得看应用背景
groups
【在 y******8 的大作中提到】
: The presumption of using statistics is that samples come from defined groups
: . But statistics itself cannot define the group.
数据来源或representation并不重要,只要量大、信息包含完整就成
你知道twitter的一个project怎么处理文本信息的吗
没有任何语言分析,甚至连词都不看,只看四个字母组成的序列
比如一条tweet是I am happy today.
那对应的feature就是I_am, _am_, ...happ,appy, ppy_....
最后根据这个,用统计方法居然能算出来语言包含的情绪
这对搞语言学分析的人是致命一击
因为只要数据在,就能算出几乎所有东西
当然,你得知道想要什么,这个还是得看应用背景
groups
【在 y******8 的大作中提到】
: The presumption of using statistics is that samples come from defined groups
: . But statistics itself cannot define the group.
y*8
29 楼
Interesting.
So, what if in a different language, half of the features of "I_am, _am_, ..
.happ,appy, ppy_...." means unhappy?
【在 D***r 的大作中提到】
: 如果计算速度足够快,算法足够先进
: 数据来源或representation并不重要,只要量大、信息包含完整就成
: 你知道twitter的一个project怎么处理文本信息的吗
: 没有任何语言分析,甚至连词都不看,只看四个字母组成的序列
: 比如一条tweet是I am happy today.
: 那对应的feature就是I_am, _am_, ...happ,appy, ppy_....
: 最后根据这个,用统计方法居然能算出来语言包含的情绪
: 这对搞语言学分析的人是致命一击
: 因为只要数据在,就能算出几乎所有东西
: 当然,你得知道想要什么,这个还是得看应用背景
So, what if in a different language, half of the features of "I_am, _am_, ..
.happ,appy, ppy_...." means unhappy?
【在 D***r 的大作中提到】
: 如果计算速度足够快,算法足够先进
: 数据来源或representation并不重要,只要量大、信息包含完整就成
: 你知道twitter的一个project怎么处理文本信息的吗
: 没有任何语言分析,甚至连词都不看,只看四个字母组成的序列
: 比如一条tweet是I am happy today.
: 那对应的feature就是I_am, _am_, ...happ,appy, ppy_....
: 最后根据这个,用统计方法居然能算出来语言包含的情绪
: 这对搞语言学分析的人是致命一击
: 因为只要数据在,就能算出几乎所有东西
: 当然,你得知道想要什么,这个还是得看应用背景
n*o
35 楼
简单的说,就是:
Lies, damned lies, and statistics
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
Lies, damned lies, and statistics
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
b*r
37 楼
你这么牛哄哄的没什么意思
对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
几年好忽悠钱,说明我远远不是唯一持这种观点的
我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
法就非常有应用前景。或者更加合理的NGS数据的快速备份,存储和读取,NGS data
meta analysis的算法,患者,医生,遗传学家互动的网站,疾病相关突变相关文献的
自动定期datamining,都是非常有应用前景,有经济效益有科研效益的方向
were
for
【在 s******a 的大作中提到】
: "因为他们混淆了相关和因果"
: I would fail you if you were my student. E Segal used very different tools
: in different subjects. In the examples of modeling yeast transcriptional
: network, the regulators and targets were clearly spelled out and tested
: experimentally.
: I was watching a video of Francis Collins this morning. He said, if he were
: to start from a graduate student, computational biology is the way to go.
: Possibilities are endless. Check out recent papers from Atual Butte lab for
: some translational examples.
对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
几年好忽悠钱,说明我远远不是唯一持这种观点的
我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
法就非常有应用前景。或者更加合理的NGS数据的快速备份,存储和读取,NGS data
meta analysis的算法,患者,医生,遗传学家互动的网站,疾病相关突变相关文献的
自动定期datamining,都是非常有应用前景,有经济效益有科研效益的方向
were
for
【在 s******a 的大作中提到】
: "因为他们混淆了相关和因果"
: I would fail you if you were my student. E Segal used very different tools
: in different subjects. In the examples of modeling yeast transcriptional
: network, the regulators and targets were clearly spelled out and tested
: experimentally.
: I was watching a video of Francis Collins this morning. He said, if he were
: to start from a graduate student, computational biology is the way to go.
: Possibilities are endless. Check out recent papers from Atual Butte lab for
: some translational examples.
O*O
38 楼
都是讨生活罢了
生物信息不管有没用
目前找个八九万的工作还是不难的
【在 b****r 的大作中提到】
: 你这么牛哄哄的没什么意思
: 对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
: 楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
: 类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
: 几年好忽悠钱,说明我远远不是唯一持这种观点的
: 我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
: 全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
: 的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
: 的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
: 。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
生物信息不管有没用
目前找个八九万的工作还是不难的
【在 b****r 的大作中提到】
: 你这么牛哄哄的没什么意思
: 对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
: 楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
: 类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
: 几年好忽悠钱,说明我远远不是唯一持这种观点的
: 我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
: 全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
: 的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
: 的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
: 。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
M*P
39 楼
Segal 他们的东西别人貌似都重复不出来的。
文)
★ 发自iPhone App: ChineseWeb 7.7
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
文)
★ 发自iPhone App: ChineseWeb 7.7
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
y*j
40 楼
很多paper是扯淡,大家一起扯淡,所以很好混,很多年轻教授啥的,属于人傻钱多(
钱不太多,但是用的也不太多)
经常有paper,如果assumption A成立,我们的方法就会好用,然后找一些assumption
A已经成立的生物学中的特例说我们的方法很好用,其实大部分时间assumption A完全
是扯淡。然后弄点儿真正的生物学问题实验一下,如果瞎猫碰上死耗子,如果work了就
高兴的说看work吧,不work就说手上数据量太少所以不work,这个方法其实还是很有前
途的。
这种paper CNS上不了,但是乱七八糟小杂志挺好登,然后就靠数量取胜了。
钱不太多,但是用的也不太多)
经常有paper,如果assumption A成立,我们的方法就会好用,然后找一些assumption
A已经成立的生物学中的特例说我们的方法很好用,其实大部分时间assumption A完全
是扯淡。然后弄点儿真正的生物学问题实验一下,如果瞎猫碰上死耗子,如果work了就
高兴的说看work吧,不work就说手上数据量太少所以不work,这个方法其实还是很有前
途的。
这种paper CNS上不了,但是乱七八糟小杂志挺好登,然后就靠数量取胜了。
a*1
41 楼
computational biology and bioinformatics are quite useful, in the following
ways:
(a) large-scale application or very complicated inferences. This type of
problems are often beyond an experimental biologist can manually handle.
Thus very useful. For genetic networks, gene expression, sequence
comparison, etc, these are all very good examples. You cannot imagine asking
a single human being to do this manually.
(b) enabling new experiments or new ways to do experiments. Some of the good
examples are based on fast screening of sequences, or microscopic images,
or gene expressions, etc, one can quickly narrow down the possibilities of
how web lab experiments should be performed, and at least increase the
change of the success. In another case, computational methods make it
possible to do otherwise difficult experiments and collect otherwise hard to
achieve data. For instance the super-resolution imaging (PALM, STORM) are
simply Gaussian fitting (a computational tech!) plus photo-activated protein
imaging. Many other cases like this.
(c) in cases there lacks experiment methods. For example the evolution
studies, computational inference is probably is most feasible way to make
progress. And somehow it does explain things.
ways:
(a) large-scale application or very complicated inferences. This type of
problems are often beyond an experimental biologist can manually handle.
Thus very useful. For genetic networks, gene expression, sequence
comparison, etc, these are all very good examples. You cannot imagine asking
a single human being to do this manually.
(b) enabling new experiments or new ways to do experiments. Some of the good
examples are based on fast screening of sequences, or microscopic images,
or gene expressions, etc, one can quickly narrow down the possibilities of
how web lab experiments should be performed, and at least increase the
change of the success. In another case, computational methods make it
possible to do otherwise difficult experiments and collect otherwise hard to
achieve data. For instance the super-resolution imaging (PALM, STORM) are
simply Gaussian fitting (a computational tech!) plus photo-activated protein
imaging. Many other cases like this.
(c) in cases there lacks experiment methods. For example the evolution
studies, computational inference is probably is most feasible way to make
progress. And somehow it does explain things.
y*j
42 楼
恩,不错,我们实验室也是这么忽悠别人的。
following
asking
good
【在 a********1 的大作中提到】
: computational biology and bioinformatics are quite useful, in the following
: ways:
: (a) large-scale application or very complicated inferences. This type of
: problems are often beyond an experimental biologist can manually handle.
: Thus very useful. For genetic networks, gene expression, sequence
: comparison, etc, these are all very good examples. You cannot imagine asking
: a single human being to do this manually.
: (b) enabling new experiments or new ways to do experiments. Some of the good
: examples are based on fast screening of sequences, or microscopic images,
: or gene expressions, etc, one can quickly narrow down the possibilities of
following
asking
good
【在 a********1 的大作中提到】
: computational biology and bioinformatics are quite useful, in the following
: ways:
: (a) large-scale application or very complicated inferences. This type of
: problems are often beyond an experimental biologist can manually handle.
: Thus very useful. For genetic networks, gene expression, sequence
: comparison, etc, these are all very good examples. You cannot imagine asking
: a single human being to do this manually.
: (b) enabling new experiments or new ways to do experiments. Some of the good
: examples are based on fast screening of sequences, or microscopic images,
: or gene expressions, etc, one can quickly narrow down the possibilities of
b*1
43 楼
There are two types of bioinformatics scientists, one building tools and
databases, the other translating existing data into biological/clinical
findings. The 2nd one is very powerful simply because tons of data have
already been generated and will continue to be generated and deposited into
thousands of public repositories. Name any disease, I can easily pull out
hundreds of data across tens of different types of experiments, and make
predictions or hypothesis. Then, you can validate your findings with all
kinds of experiments in core facilities or outsourcing companies with a
credit card. The person who wins is always the person who owns the largest
amount of data, and bioinformatics scientists knows how to find all these
data.
Bioinformatics is powerful simply because exploding amount of data have
already been generated by millions of scientists around the world.
databases, the other translating existing data into biological/clinical
findings. The 2nd one is very powerful simply because tons of data have
already been generated and will continue to be generated and deposited into
thousands of public repositories. Name any disease, I can easily pull out
hundreds of data across tens of different types of experiments, and make
predictions or hypothesis. Then, you can validate your findings with all
kinds of experiments in core facilities or outsourcing companies with a
credit card. The person who wins is always the person who owns the largest
amount of data, and bioinformatics scientists knows how to find all these
data.
Bioinformatics is powerful simply because exploding amount of data have
already been generated by millions of scientists around the world.
b*r
44 楼
1的问题是这种分析出来的结果往往难以为后续实验逐个的验证,因为很多就是扯蛋的
,一堆根本就是不挨边的assumption。不说别的,就说现有的根据文献报道给network
里各个基因以及interaction的权重的方法,干这行的都知道,那种算法有多么不靠谱
有多少错误和遗漏。混饭吃当然可以,但是楼主不是讨论哪个方向有前途吗?在我看来
现有人类科技还得再发展20年以上,看看有没有希望开始对文献报道的信息进行比较准
确的自动分析和加权。
2已经包括了比如我比较看好的NGS data,我基本同意
3比如进化这种玩意,更别说什么前途不前途了,混饭吃都困难,领域里的学霸都只能
吃渣,新晋的中国小老板,汤都喝不上
following
asking
good
【在 a********1 的大作中提到】
: computational biology and bioinformatics are quite useful, in the following
: ways:
: (a) large-scale application or very complicated inferences. This type of
: problems are often beyond an experimental biologist can manually handle.
: Thus very useful. For genetic networks, gene expression, sequence
: comparison, etc, these are all very good examples. You cannot imagine asking
: a single human being to do this manually.
: (b) enabling new experiments or new ways to do experiments. Some of the good
: examples are based on fast screening of sequences, or microscopic images,
: or gene expressions, etc, one can quickly narrow down the possibilities of
,一堆根本就是不挨边的assumption。不说别的,就说现有的根据文献报道给network
里各个基因以及interaction的权重的方法,干这行的都知道,那种算法有多么不靠谱
有多少错误和遗漏。混饭吃当然可以,但是楼主不是讨论哪个方向有前途吗?在我看来
现有人类科技还得再发展20年以上,看看有没有希望开始对文献报道的信息进行比较准
确的自动分析和加权。
2已经包括了比如我比较看好的NGS data,我基本同意
3比如进化这种玩意,更别说什么前途不前途了,混饭吃都困难,领域里的学霸都只能
吃渣,新晋的中国小老板,汤都喝不上
following
asking
good
【在 a********1 的大作中提到】
: computational biology and bioinformatics are quite useful, in the following
: ways:
: (a) large-scale application or very complicated inferences. This type of
: problems are often beyond an experimental biologist can manually handle.
: Thus very useful. For genetic networks, gene expression, sequence
: comparison, etc, these are all very good examples. You cannot imagine asking
: a single human being to do this manually.
: (b) enabling new experiments or new ways to do experiments. Some of the good
: examples are based on fast screening of sequences, or microscopic images,
: or gene expressions, etc, one can quickly narrow down the possibilities of
m*k
45 楼
我的理解是bioinformatics大部分是基于statistics的,是从大量数据中找
correlation,所以结果的准确性跟现有数据的质量有关。
computational biology里面也有另外一种deterministic的方法,就是在计算机上用用
动力学方法模拟生物分子的构象变化和相互作用等,有完善的经典力学理论支持。只要
描述各原子的力场参数足够准确,结果就正确,是确定性的,对现有实验数据的依赖性
小。不过这个方法研究的体系太小。
correlation,所以结果的准确性跟现有数据的质量有关。
computational biology里面也有另外一种deterministic的方法,就是在计算机上用用
动力学方法模拟生物分子的构象变化和相互作用等,有完善的经典力学理论支持。只要
描述各原子的力场参数足够准确,结果就正确,是确定性的,对现有实验数据的依赖性
小。不过这个方法研究的体系太小。
b*n
46 楼
不少生物信息学的方法就是这两种思路
一种就是纯物理纯计算的方法计算各种参数
另一种就是机器学习,需要有效的统计学模型
【在 m*k 的大作中提到】
: 我的理解是bioinformatics大部分是基于statistics的,是从大量数据中找
: correlation,所以结果的准确性跟现有数据的质量有关。
: computational biology里面也有另外一种deterministic的方法,就是在计算机上用用
: 动力学方法模拟生物分子的构象变化和相互作用等,有完善的经典力学理论支持。只要
: 描述各原子的力场参数足够准确,结果就正确,是确定性的,对现有实验数据的依赖性
: 小。不过这个方法研究的体系太小。
一种就是纯物理纯计算的方法计算各种参数
另一种就是机器学习,需要有效的统计学模型
【在 m*k 的大作中提到】
: 我的理解是bioinformatics大部分是基于statistics的,是从大量数据中找
: correlation,所以结果的准确性跟现有数据的质量有关。
: computational biology里面也有另外一种deterministic的方法,就是在计算机上用用
: 动力学方法模拟生物分子的构象变化和相互作用等,有完善的经典力学理论支持。只要
: 描述各原子的力场参数足够准确,结果就正确,是确定性的,对现有实验数据的依赖性
: 小。不过这个方法研究的体系太小。
t*a
47 楼
谢谢你的回复。
你说的那些应用都很promising。可是,建数据库,做in/del call的tools,或者做生
物学家交流用的网站,需要经过PhD训练的人做么?这样的事情看起来不过是计算机工
程学,没有发现新的知识,不是科学啊。
除了这些工程以外,生物信息学专业的人应该做什么事情才是“科学”呢?
【在 b****r 的大作中提到】
: 你这么牛哄哄的没什么意思
: 对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
: 楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
: 类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
: 几年好忽悠钱,说明我远远不是唯一持这种观点的
: 我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
: 全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
: 的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
: 的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
: 。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
你说的那些应用都很promising。可是,建数据库,做in/del call的tools,或者做生
物学家交流用的网站,需要经过PhD训练的人做么?这样的事情看起来不过是计算机工
程学,没有发现新的知识,不是科学啊。
除了这些工程以外,生物信息学专业的人应该做什么事情才是“科学”呢?
【在 b****r 的大作中提到】
: 你这么牛哄哄的没什么意思
: 对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
: 楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
: 类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
: 几年好忽悠钱,说明我远远不是唯一持这种观点的
: 我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
: 全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
: 的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
: 的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
: 。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
d*f
49 楼
每天养老鼠的的确不会明白其实很多东西不需要杀1000只老鼠,只需要让电脑跑千分之
秒就解决了
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
秒就解决了
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
l*1
50 楼
>第二,大部分目前的算法都只能找线性相关。
布林函数/行列式 的Petri nets 可以对非同步的 Gene Regulatory Networks
减少计算参数 而
倍业斯或 Hidden Markov Monte Carlo 能找 NGS RNA-seq Gene Regulatory
Networks 非线性相关吧
具体参看
Mogilner A et al. (2012)
Cell polarity: quantitative modeling as a tool in cell biology.
Science. 336: 175-9.
web link:
http://www.ncbi.nlm.nih.gov/pubmed/22499937
plus 下图
cited from PPT slide:
web link:
HTTP: //www-dssz.informatik.tu-cottbus.de/publications/BioPPN_2011/BioPPN_
2011_1.pdf
or one 2011 paper:
link:
HTTP: //ceur-ws.org/Vol-724/paper2.pdf
还有自己Google Scholar 下 有 一大堆呢
【在 t****a 的大作中提到】
: 第一,这些高通量数据的噪音非常大。
: 第二,大部分目前的算法都只能找线性相关。
: 第三,当系统非常复杂的时候,相关 和 因果 简直是风马牛不相及。
: 考虑到这些,先鉴定相关,然后通过实验找因果恐怕是个非常非常低效率的过程,我有
: 时候觉得他们比瞎猜都好不到哪去。
: 这也是我看这类的论文心里非常怀疑的原因
布林函数/行列式 的Petri nets 可以对非同步的 Gene Regulatory Networks
减少计算参数 而
倍业斯或 Hidden Markov Monte Carlo 能找 NGS RNA-seq Gene Regulatory
Networks 非线性相关吧
具体参看
Mogilner A et al. (2012)
Cell polarity: quantitative modeling as a tool in cell biology.
Science. 336: 175-9.
web link:
http://www.ncbi.nlm.nih.gov/pubmed/22499937
plus 下图
cited from PPT slide:
web link:
HTTP: //www-dssz.informatik.tu-cottbus.de/publications/BioPPN_2011/BioPPN_
2011_1.pdf
or one 2011 paper:
link:
HTTP: //ceur-ws.org/Vol-724/paper2.pdf
还有自己Google Scholar 下 有 一大堆呢
【在 t****a 的大作中提到】
: 第一,这些高通量数据的噪音非常大。
: 第二,大部分目前的算法都只能找线性相关。
: 第三,当系统非常复杂的时候,相关 和 因果 简直是风马牛不相及。
: 考虑到这些,先鉴定相关,然后通过实验找因果恐怕是个非常非常低效率的过程,我有
: 时候觉得他们比瞎猜都好不到哪去。
: 这也是我看这类的论文心里非常怀疑的原因
s*a
51 楼
我上面说了让楼主读一下Butte Lab最近的文章,看一下怎么应用的。
你的观点就很像Butte一系的,呵呵。
into
【在 b*******1 的大作中提到】
: There are two types of bioinformatics scientists, one building tools and
: databases, the other translating existing data into biological/clinical
: findings. The 2nd one is very powerful simply because tons of data have
: already been generated and will continue to be generated and deposited into
: thousands of public repositories. Name any disease, I can easily pull out
: hundreds of data across tens of different types of experiments, and make
: predictions or hypothesis. Then, you can validate your findings with all
: kinds of experiments in core facilities or outsourcing companies with a
: credit card. The person who wins is always the person who owns the largest
: amount of data, and bioinformatics scientists knows how to find all these
你的观点就很像Butte一系的,呵呵。
into
【在 b*******1 的大作中提到】
: There are two types of bioinformatics scientists, one building tools and
: databases, the other translating existing data into biological/clinical
: findings. The 2nd one is very powerful simply because tons of data have
: already been generated and will continue to be generated and deposited into
: thousands of public repositories. Name any disease, I can easily pull out
: hundreds of data across tens of different types of experiments, and make
: predictions or hypothesis. Then, you can validate your findings with all
: kinds of experiments in core facilities or outsourcing companies with a
: credit card. The person who wins is always the person who owns the largest
: amount of data, and bioinformatics scientists knows how to find all these
s*a
52 楼
在前面提到的Segal的例子,他在yeast models用了bayesian inference,在cancer
module maps用的是predefined gene sets。每个statistical inference/machine
learning的入门课程都要强调correlation vs causality。楼主一起用哲学的棒子打过
来,说明的是读文章不用心,治学态度有问题。
每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本来
就是每个人自己要分析把握的事情。一味的抱怨某个学科,有点太小儿科了。
【在 b****r 的大作中提到】
: 你这么牛哄哄的没什么意思
: 对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
: 楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
: 类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
: 几年好忽悠钱,说明我远远不是唯一持这种观点的
: 我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
: 全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
: 的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
: 的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
: 。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
module maps用的是predefined gene sets。每个statistical inference/machine
learning的入门课程都要强调correlation vs causality。楼主一起用哲学的棒子打过
来,说明的是读文章不用心,治学态度有问题。
每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本来
就是每个人自己要分析把握的事情。一味的抱怨某个学科,有点太小儿科了。
【在 b****r 的大作中提到】
: 你这么牛哄哄的没什么意思
: 对于真正应用价值高的很多数据,据我所知还根本做不到区分因果,也就是说我很同意
: 楼主所说,很多时候就是垃圾,得不出什么值得深入做下去的结论。我自己做过一些这
: 类课题也读过不少类似文章,这就是我的感觉。最近几年所谓system biology远不如前
: 几年好忽悠钱,说明我远远不是唯一持这种观点的
: 我觉得生物信息学是整个生物学工作走向应用的几乎最后一个环节,而且相对而言,完
: 全不是短板。生物学目前来说还是个实验科学,短板还在实验环节。实验技术突飞猛进
: 的领域才是生物信息学比较有机会快速前进的领域。什么基因表达,已经是大家不想吃
: 的剩饭了,最近若干年都应该会继续停留在平台期,继续啃这个方向不饿死就算不错了
: 。我比较看好的,近几年还是在NGS的应用,打个比方,对in/del的 call的更理想的算
y*j
54 楼
对,至少我眼中大部分做生物信息的是做工程的。
我觉着工程方面着重于提供工具解决问题,科学着重问问题然后用实验解释问题。
想做科学,一方面是从CS那方面,我不是大拿,所以不好说太多。另外一方面就是从生
物这方面,主要就是问问题了,你啥时候能问出一个非常重要的生物学问题,但是用传
统的几
个实验解决不了,但是能用几个实验加上一些数学模型能解决了,CNS就离你不远了。
现在生物信息学真正的问题我脚着不是在于算法问题,而是明白生物的不知道有什么数
学工具可用,明白数学的对于生物问题和数据没有一个正确的理解,更不用说问问题了。
【在 t****a 的大作中提到】
: 谢谢你的回复。
: 你说的那些应用都很promising。可是,建数据库,做in/del call的tools,或者做生
: 物学家交流用的网站,需要经过PhD训练的人做么?这样的事情看起来不过是计算机工
: 程学,没有发现新的知识,不是科学啊。
: 除了这些工程以外,生物信息学专业的人应该做什么事情才是“科学”呢?
我觉着工程方面着重于提供工具解决问题,科学着重问问题然后用实验解释问题。
想做科学,一方面是从CS那方面,我不是大拿,所以不好说太多。另外一方面就是从生
物这方面,主要就是问问题了,你啥时候能问出一个非常重要的生物学问题,但是用传
统的几
个实验解决不了,但是能用几个实验加上一些数学模型能解决了,CNS就离你不远了。
现在生物信息学真正的问题我脚着不是在于算法问题,而是明白生物的不知道有什么数
学工具可用,明白数学的对于生物问题和数据没有一个正确的理解,更不用说问问题了。
【在 t****a 的大作中提到】
: 谢谢你的回复。
: 你说的那些应用都很promising。可是,建数据库,做in/del call的tools,或者做生
: 物学家交流用的网站,需要经过PhD训练的人做么?这样的事情看起来不过是计算机工
: 程学,没有发现新的知识,不是科学啊。
: 除了这些工程以外,生物信息学专业的人应该做什么事情才是“科学”呢?
t*a
55 楼
谢谢回复,继续讨论
“他在yeast models用了bayesian inference,在cancer module maps用的是
predefined gene sets。”如何就可以避免correlation,一步从RNA level的
microarray数据里推出causality了呢?恕我愚昧,我看不懂这个逻辑。
“每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本
来就是每个人自己要分析把握的事情。”这句话说的非常有道理。
【在 s******a 的大作中提到】
: 在前面提到的Segal的例子,他在yeast models用了bayesian inference,在cancer
: module maps用的是predefined gene sets。每个statistical inference/machine
: learning的入门课程都要强调correlation vs causality。楼主一起用哲学的棒子打过
: 来,说明的是读文章不用心,治学态度有问题。
: 每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本来
: 就是每个人自己要分析把握的事情。一味的抱怨某个学科,有点太小儿科了。
“他在yeast models用了bayesian inference,在cancer module maps用的是
predefined gene sets。”如何就可以避免correlation,一步从RNA level的
microarray数据里推出causality了呢?恕我愚昧,我看不懂这个逻辑。
“每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本
来就是每个人自己要分析把握的事情。”这句话说的非常有道理。
【在 s******a 的大作中提到】
: 在前面提到的Segal的例子,他在yeast models用了bayesian inference,在cancer
: module maps用的是predefined gene sets。每个statistical inference/machine
: learning的入门课程都要强调correlation vs causality。楼主一起用哲学的棒子打过
: 来,说明的是读文章不用心,治学态度有问题。
: 每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本来
: 就是每个人自己要分析把握的事情。一味的抱怨某个学科,有点太小儿科了。
t*a
56 楼
谢谢提供这些很有价值的信息。
【在 l**********1 的大作中提到】
: >第二,大部分目前的算法都只能找线性相关。
: 布林函数/行列式 的Petri nets 可以对非同步的 Gene Regulatory Networks
: 减少计算参数 而
: 倍业斯或 Hidden Markov Monte Carlo 能找 NGS RNA-seq Gene Regulatory
: Networks 非线性相关吧
: 具体参看
: Mogilner A et al. (2012)
: Cell polarity: quantitative modeling as a tool in cell biology.
: Science. 336: 175-9.
: web link:
【在 l**********1 的大作中提到】
: >第二,大部分目前的算法都只能找线性相关。
: 布林函数/行列式 的Petri nets 可以对非同步的 Gene Regulatory Networks
: 减少计算参数 而
: 倍业斯或 Hidden Markov Monte Carlo 能找 NGS RNA-seq Gene Regulatory
: Networks 非线性相关吧
: 具体参看
: Mogilner A et al. (2012)
: Cell polarity: quantitative modeling as a tool in cell biology.
: Science. 336: 175-9.
: web link:
y*j
58 楼
其实还是不踏实。
现在生物研究基本上就是,一堆野人,连个牛顿定律都还没有的情况下,研究飞机怎么
飞起来的。做生物的就是纯盲人摸象,做系统生物学的基本很多人是在瞎忽悠。
原因吧我觉得还是穷,没人给钱让做生物的能仓廪足,踏踏实实的做研究,从最基础的
做起,全是弄个什么节操没下限的translational research到处瞎骗钱,牛顿定律都不
知道,修个鸡毛飞机呀。其实也不赖学生物的,学了这么多年谁教过数学什么的,玩命
做了这么多年试验,谁不想过好日子呀,不骗钱活不下去,就是这么简单。
【在 d********f 的大作中提到】
: 这不是外行不外行的问题,是纯高生物的从来其实都没什么创造力。整个现代生物学都
: 是建立在其他学科的偶然发现上,如果没有DNA模型,今天的生物学连科学都不算,当
: 然现在也不能算,我觉得目前的主要方向应该是把微积分运用到生物学研究中了,物理
: 学在没有微积分之前也是一个文科方向
现在生物研究基本上就是,一堆野人,连个牛顿定律都还没有的情况下,研究飞机怎么
飞起来的。做生物的就是纯盲人摸象,做系统生物学的基本很多人是在瞎忽悠。
原因吧我觉得还是穷,没人给钱让做生物的能仓廪足,踏踏实实的做研究,从最基础的
做起,全是弄个什么节操没下限的translational research到处瞎骗钱,牛顿定律都不
知道,修个鸡毛飞机呀。其实也不赖学生物的,学了这么多年谁教过数学什么的,玩命
做了这么多年试验,谁不想过好日子呀,不骗钱活不下去,就是这么简单。
【在 d********f 的大作中提到】
: 这不是外行不外行的问题,是纯高生物的从来其实都没什么创造力。整个现代生物学都
: 是建立在其他学科的偶然发现上,如果没有DNA模型,今天的生物学连科学都不算,当
: 然现在也不能算,我觉得目前的主要方向应该是把微积分运用到生物学研究中了,物理
: 学在没有微积分之前也是一个文科方向
d*f
59 楼
我早就讲了,NIH这种资助力度害了生物学,根本没人再认真做研究,全市骗钱的。把
funding砍光九对了,真正能静下心做研究的都不要钱
【在 y***j 的大作中提到】
: 其实还是不踏实。
: 现在生物研究基本上就是,一堆野人,连个牛顿定律都还没有的情况下,研究飞机怎么
: 飞起来的。做生物的就是纯盲人摸象,做系统生物学的基本很多人是在瞎忽悠。
: 原因吧我觉得还是穷,没人给钱让做生物的能仓廪足,踏踏实实的做研究,从最基础的
: 做起,全是弄个什么节操没下限的translational research到处瞎骗钱,牛顿定律都不
: 知道,修个鸡毛飞机呀。其实也不赖学生物的,学了这么多年谁教过数学什么的,玩命
: 做了这么多年试验,谁不想过好日子呀,不骗钱活不下去,就是这么简单。
funding砍光九对了,真正能静下心做研究的都不要钱
【在 y***j 的大作中提到】
: 其实还是不踏实。
: 现在生物研究基本上就是,一堆野人,连个牛顿定律都还没有的情况下,研究飞机怎么
: 飞起来的。做生物的就是纯盲人摸象,做系统生物学的基本很多人是在瞎忽悠。
: 原因吧我觉得还是穷,没人给钱让做生物的能仓廪足,踏踏实实的做研究,从最基础的
: 做起,全是弄个什么节操没下限的translational research到处瞎骗钱,牛顿定律都不
: 知道,修个鸡毛飞机呀。其实也不赖学生物的,学了这么多年谁教过数学什么的,玩命
: 做了这么多年试验,谁不想过好日子呀,不骗钱活不下去,就是这么简单。
s*a
60 楼
Here is how I read the papers, if you ever did -
(1) in
Segal E, Shapira M, Regev A, Pe'er D, Botstein D, Koller D, Friedman N.
Module networks: identifying regulatory modules and their condition-specific
regulators from gene expression data. Nat Genet. 2003 Jun;34(2):166-76.
The candidate regulators were defined in prior based on biological
annotations. Promoter analysis was also used to help identify
transcriptional regulation. These are very specific biological models and
define the causality in this context. The causality was not from microarray
data alone.
(2) in
Segal E, Friedman N, Koller D, Regev A. A module map showing conditional
activity of expression modules in cancer. Nat Genet. 2004 Oct;36(10):1090-8.
The authors stated:
"In conclusion, our method provides a global view of cancer and
shows that tumors can be characterized by combinations of a relatively
small number of modules. "
That is what it was. It was a characterization study not a causality study.
The authors were cautious not to over-interpret the data.
【在 t****a 的大作中提到】
: 谢谢回复,继续讨论
: “他在yeast models用了bayesian inference,在cancer module maps用的是
: predefined gene sets。”如何就可以避免correlation,一步从RNA level的
: microarray数据里推出causality了呢?恕我愚昧,我看不懂这个逻辑。
: “每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本
: 来就是每个人自己要分析把握的事情。”这句话说的非常有道理。
(1) in
Segal E, Shapira M, Regev A, Pe'er D, Botstein D, Koller D, Friedman N.
Module networks: identifying regulatory modules and their condition-specific
regulators from gene expression data. Nat Genet. 2003 Jun;34(2):166-76.
The candidate regulators were defined in prior based on biological
annotations. Promoter analysis was also used to help identify
transcriptional regulation. These are very specific biological models and
define the causality in this context. The causality was not from microarray
data alone.
(2) in
Segal E, Friedman N, Koller D, Regev A. A module map showing conditional
activity of expression modules in cancer. Nat Genet. 2004 Oct;36(10):1090-8.
The authors stated:
"In conclusion, our method provides a global view of cancer and
shows that tumors can be characterized by combinations of a relatively
small number of modules. "
That is what it was. It was a characterization study not a causality study.
The authors were cautious not to over-interpret the data.
【在 t****a 的大作中提到】
: 谢谢回复,继续讨论
: “他在yeast models用了bayesian inference,在cancer module maps用的是
: predefined gene sets。”如何就可以避免correlation,一步从RNA level的
: microarray数据里推出causality了呢?恕我愚昧,我看不懂这个逻辑。
: “每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本
: 来就是每个人自己要分析把握的事情。”这句话说的非常有道理。
t*a
61 楼
感谢你务实的态度,把论文找出来供大家探讨,非常感谢
下面是我的拙见:
简单说来就是regulator信息+promoter based regulator predicting信息 +
microarray correlation。
逻辑是,因为promoter based regulator是causality的,所以结果就是causality
的。microarray是用来帮助筛选的。
可是promoter based那些玩意,在高等生物里的预测准确度,大家应该都知道怎么回事
,对吧。在此基础上加上一个correlation来筛选,真的能找出可以拿去做实验验证的
东西么?
而且,这篇文章里的microarray,也没有起到帮助推导causality的作用,它就还是一
个相关~
specific
microarray
【在 s******a 的大作中提到】
: Here is how I read the papers, if you ever did -
: (1) in
: Segal E, Shapira M, Regev A, Pe'er D, Botstein D, Koller D, Friedman N.
: Module networks: identifying regulatory modules and their condition-specific
: regulators from gene expression data. Nat Genet. 2003 Jun;34(2):166-76.
: The candidate regulators were defined in prior based on biological
: annotations. Promoter analysis was also used to help identify
: transcriptional regulation. These are very specific biological models and
: define the causality in this context. The causality was not from microarray
: data alone.
下面是我的拙见:
简单说来就是regulator信息+promoter based regulator predicting信息 +
microarray correlation。
逻辑是,因为promoter based regulator是causality的,所以结果就是causality
的。microarray是用来帮助筛选的。
可是promoter based那些玩意,在高等生物里的预测准确度,大家应该都知道怎么回事
,对吧。在此基础上加上一个correlation来筛选,真的能找出可以拿去做实验验证的
东西么?
而且,这篇文章里的microarray,也没有起到帮助推导causality的作用,它就还是一
个相关~
specific
microarray
【在 s******a 的大作中提到】
: Here is how I read the papers, if you ever did -
: (1) in
: Segal E, Shapira M, Regev A, Pe'er D, Botstein D, Koller D, Friedman N.
: Module networks: identifying regulatory modules and their condition-specific
: regulators from gene expression data. Nat Genet. 2003 Jun;34(2):166-76.
: The candidate regulators were defined in prior based on biological
: annotations. Promoter analysis was also used to help identify
: transcriptional regulation. These are very specific biological models and
: define the causality in this context. The causality was not from microarray
: data alone.
t*a
64 楼
谢谢回复。我PhD期间就一直在2的方向努力。
2对课题挑选,数据选择等等都很有要求的。很多数据后面的meta data不清楚,有些不
同实验室的数据根本就不能放在一起分析,不然自己都不相信结果...我的生物学底子
很差,这里遇到很大的困难。
into
【在 b*******1 的大作中提到】
: There are two types of bioinformatics scientists, one building tools and
: databases, the other translating existing data into biological/clinical
: findings. The 2nd one is very powerful simply because tons of data have
: already been generated and will continue to be generated and deposited into
: thousands of public repositories. Name any disease, I can easily pull out
: hundreds of data across tens of different types of experiments, and make
: predictions or hypothesis. Then, you can validate your findings with all
: kinds of experiments in core facilities or outsourcing companies with a
: credit card. The person who wins is always the person who owns the largest
: amount of data, and bioinformatics scientists knows how to find all these
2对课题挑选,数据选择等等都很有要求的。很多数据后面的meta data不清楚,有些不
同实验室的数据根本就不能放在一起分析,不然自己都不相信结果...我的生物学底子
很差,这里遇到很大的困难。
into
【在 b*******1 的大作中提到】
: There are two types of bioinformatics scientists, one building tools and
: databases, the other translating existing data into biological/clinical
: findings. The 2nd one is very powerful simply because tons of data have
: already been generated and will continue to be generated and deposited into
: thousands of public repositories. Name any disease, I can easily pull out
: hundreds of data across tens of different types of experiments, and make
: predictions or hypothesis. Then, you can validate your findings with all
: kinds of experiments in core facilities or outsourcing companies with a
: credit card. The person who wins is always the person who owns the largest
: amount of data, and bioinformatics scientists knows how to find all these
y*j
69 楼
研究者太多是个问题。我一直觉得搞科学的至少都应该是不愁吃穿,把科学当爱好搞得
才能真正高出有用的东西。人多了光顾着与人斗其乐无穷了。
PhD太多,PhD教育就是往PI培养的,哪有这么多PI位置。如果PhD都没奖学金了,这一
步就筛选掉了很多动机不纯的,没有这么多PhD,,以后千老到PI都会少很多,到时候钱
就算少一些,平均到每个人头还是会多些
,大家整天就不是想着怎么进那10%了,大概有个筛选机制,不让大家太懒就好了,然
后从最基础的干起,不用整天想着什么funding,和CNS什么的,个人觉得会好很多。
【在 d********f 的大作中提到】
: 我不开玩笑,我认为学术研究本来就是一个非尖端不必作的事情,学术研究泛滥化是学
: 术水平下降的主要原因。你想想你一天要花多少时间看那些学术垃圾,听狗皮不同的‘
: 学术’报告。一个学科的黄金时期往往是研究者人数不超过3位数的事情,等你把这玩
: 艺弄成一个几百亿美金的产业,这就是山寨了
才能真正高出有用的东西。人多了光顾着与人斗其乐无穷了。
PhD太多,PhD教育就是往PI培养的,哪有这么多PI位置。如果PhD都没奖学金了,这一
步就筛选掉了很多动机不纯的,没有这么多PhD,,以后千老到PI都会少很多,到时候钱
就算少一些,平均到每个人头还是会多些
,大家整天就不是想着怎么进那10%了,大概有个筛选机制,不让大家太懒就好了,然
后从最基础的干起,不用整天想着什么funding,和CNS什么的,个人觉得会好很多。
【在 d********f 的大作中提到】
: 我不开玩笑,我认为学术研究本来就是一个非尖端不必作的事情,学术研究泛滥化是学
: 术水平下降的主要原因。你想想你一天要花多少时间看那些学术垃圾,听狗皮不同的‘
: 学术’报告。一个学科的黄金时期往往是研究者人数不超过3位数的事情,等你把这玩
: 艺弄成一个几百亿美金的产业,这就是山寨了
y*t
70 楼
因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
。
但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
, 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
。
但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
, 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
y*j
71 楼
这个不太一样吧。股票那个是应用性的,不需要后面的机理也就是说数字上的
correlation就够了,不需要causal relationship,科学的最终目的还是要发现背后机
理的。
股票期货我的理解是在一个平稳没有增长没有降低的市场上如果做一个交易假定随机交
易赔钱概率50%赚钱概率50%,做1000次交易,你最后的结果是不赚不陪,你做出一个比
较烂的model稍微改善一下,能达到40%赔钱60%赚钱,做1000次交易你就有200次交易是
赚钱的,可以说是一个够用的好模型了。而且股票期货交易的模型我理解也是减少投资
者因
为贪婪造成该涨的时候改卖没卖,跌的时候该割肉时候舍不得割吧。
如果生物学科你觉得一个错误率40%的模型是好模型么?
【在 y****t 的大作中提到】
: 因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
: 靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
: 下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
: 。
: 但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
: 觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
: , 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
: 我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
:
: 文)
correlation就够了,不需要causal relationship,科学的最终目的还是要发现背后机
理的。
股票期货我的理解是在一个平稳没有增长没有降低的市场上如果做一个交易假定随机交
易赔钱概率50%赚钱概率50%,做1000次交易,你最后的结果是不赚不陪,你做出一个比
较烂的model稍微改善一下,能达到40%赔钱60%赚钱,做1000次交易你就有200次交易是
赚钱的,可以说是一个够用的好模型了。而且股票期货交易的模型我理解也是减少投资
者因
为贪婪造成该涨的时候改卖没卖,跌的时候该割肉时候舍不得割吧。
如果生物学科你觉得一个错误率40%的模型是好模型么?
【在 y****t 的大作中提到】
: 因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
: 靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
: 下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
: 。
: 但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
: 觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
: , 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
: 我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
:
: 文)
l*1
72 楼
不谢
plus
i,
Allele frequencies as Stochastic Processes
Mathematical and Statistical Approaches PPT slide
by Gota Morota
already converted to PDF file
link:
HTTP: //www.ansci.wisc.edu/morota/beamer/allele.pdf
ii, one big bull of this field whom named Peter Müller
his papers web link:
HTTP: //www.math.utexas.edu/users/pmueller/paper.html
【在 t****a 的大作中提到】
: 谢谢提供这些很有价值的信息。
plus
i,
Allele frequencies as Stochastic Processes
Mathematical and Statistical Approaches PPT slide
by Gota Morota
already converted to PDF file
link:
HTTP: //www.ansci.wisc.edu/morota/beamer/allele.pdf
ii, one big bull of this field whom named Peter Müller
his papers web link:
HTTP: //www.math.utexas.edu/users/pmueller/paper.html
【在 t****a 的大作中提到】
: 谢谢提供这些很有价值的信息。
G*G
73 楼
Suppose a biology be a table, then the computational biology is one of the
four legs.
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
four legs.
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
e*o
77 楼
知其然,还要知其所以然。
要不然数票子心里不踏实。 :)
【在 y****t 的大作中提到】
: 因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
: 靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
: 下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
: 。
: 但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
: 觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
: , 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
: 我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
:
: 文)
要不然数票子心里不踏实。 :)
【在 y****t 的大作中提到】
: 因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
: 靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
: 下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
: 。
: 但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
: 觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
: , 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
: 我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
:
: 文)
t*a
79 楼
我认为科学发展里重要的一环是假说。科学在我眼里就是在试图用简单的原则解释复杂
的观察。找各种相关之类的玩意最多就是收集素材,远远到不了假说这个层面。
我有限的知识,不觉得现在的生物信息学可以成为构筑假说的重要一环。上面一个朋友
给我的链接我得好好看看。
【在 P****D 的大作中提到】
: 整个科学的发展就是靠瞎猜->实验验证->瞎猜->实验验证,从几千年前到今天都是这个
: 逻辑:
: 某两个东西常常一起出现,可能有联系->做实验->真的有因果关系!应用之!(实验发
: 现没有因果关系的情况就不说了)->用着用着,在某些情况下不好使了->猜想可能是之
: 前的实验或者设计有缺陷,或者技术水平不够,导致错误结论->新实验->原来它们之间
: 的关系是这样的!->应用->继续,继续,继续……
: 不然你给我说说,你认为科学发展是个什么逻辑过程?
的观察。找各种相关之类的玩意最多就是收集素材,远远到不了假说这个层面。
我有限的知识,不觉得现在的生物信息学可以成为构筑假说的重要一环。上面一个朋友
给我的链接我得好好看看。
【在 P****D 的大作中提到】
: 整个科学的发展就是靠瞎猜->实验验证->瞎猜->实验验证,从几千年前到今天都是这个
: 逻辑:
: 某两个东西常常一起出现,可能有联系->做实验->真的有因果关系!应用之!(实验发
: 现没有因果关系的情况就不说了)->用着用着,在某些情况下不好使了->猜想可能是之
: 前的实验或者设计有缺陷,或者技术水平不够,导致错误结论->新实验->原来它们之间
: 的关系是这样的!->应用->继续,继续,继续……
: 不然你给我说说,你认为科学发展是个什么逻辑过程?
y*j
80 楼
人家意思,科学是有靠瞎猜的时候,他觉得的他做的对于瞎猜没啥帮助。生物信息学一
相关都是一堆基因。瞎猜300个基因,生物信息学帮助缩小到30个基因还是没办法做。
还有可能真正有用的再另外270个基因里。
【在 P****D 的大作中提到】
: 整个科学的发展就是靠瞎猜->实验验证->瞎猜->实验验证,从几千年前到今天都是这个
: 逻辑:
: 某两个东西常常一起出现,可能有联系->做实验->真的有因果关系!应用之!(实验发
: 现没有因果关系的情况就不说了)->用着用着,在某些情况下不好使了->猜想可能是之
: 前的实验或者设计有缺陷,或者技术水平不够,导致错误结论->新实验->原来它们之间
: 的关系是这样的!->应用->继续,继续,继续……
: 不然你给我说说,你认为科学发展是个什么逻辑过程?
相关都是一堆基因。瞎猜300个基因,生物信息学帮助缩小到30个基因还是没办法做。
还有可能真正有用的再另外270个基因里。
【在 P****D 的大作中提到】
: 整个科学的发展就是靠瞎猜->实验验证->瞎猜->实验验证,从几千年前到今天都是这个
: 逻辑:
: 某两个东西常常一起出现,可能有联系->做实验->真的有因果关系!应用之!(实验发
: 现没有因果关系的情况就不说了)->用着用着,在某些情况下不好使了->猜想可能是之
: 前的实验或者设计有缺陷,或者技术水平不够,导致错误结论->新实验->原来它们之间
: 的关系是这样的!->应用->继续,继续,继续……
: 不然你给我说说,你认为科学发展是个什么逻辑过程?
b*r
81 楼
我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
这个领域一定就很快发展,值得跳进去吗
非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
好的应用,不知道你读文章用心没
【在 s******a 的大作中提到】
: 在前面提到的Segal的例子,他在yeast models用了bayesian inference,在cancer
: module maps用的是predefined gene sets。每个statistical inference/machine
: learning的入门课程都要强调correlation vs causality。楼主一起用哲学的棒子打过
: 来,说明的是读文章不用心,治学态度有问题。
: 每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本来
: 就是每个人自己要分析把握的事情。一味的抱怨某个学科,有点太小儿科了。
认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
这个领域一定就很快发展,值得跳进去吗
非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
好的应用,不知道你读文章用心没
【在 s******a 的大作中提到】
: 在前面提到的Segal的例子,他在yeast models用了bayesian inference,在cancer
: module maps用的是predefined gene sets。每个statistical inference/machine
: learning的入门课程都要强调correlation vs causality。楼主一起用哲学的棒子打过
: 来,说明的是读文章不用心,治学态度有问题。
: 每个领域在新兴的时候都容易拿钱,容易发文章。每个领域的文章都参差不齐。这本来
: 就是每个人自己要分析把握的事情。一味的抱怨某个学科,有点太小儿科了。
b*r
82 楼
我说的这些东西,现在都是PhD甚至HHMI,院士级别的人在做,可是在我看来还很原始
很不好用,非常需要有更强的人来做更好的工作
至于科学还是工程,在我看来不是什么重要的问题,能够解决别人解决不了的或者是还
没来得及解决的实际问题,在我看来就是牛人,就是一个好的学者
【在 t****a 的大作中提到】
: 谢谢你的回复。
: 你说的那些应用都很promising。可是,建数据库,做in/del call的tools,或者做生
: 物学家交流用的网站,需要经过PhD训练的人做么?这样的事情看起来不过是计算机工
: 程学,没有发现新的知识,不是科学啊。
: 除了这些工程以外,生物信息学专业的人应该做什么事情才是“科学”呢?
很不好用,非常需要有更强的人来做更好的工作
至于科学还是工程,在我看来不是什么重要的问题,能够解决别人解决不了的或者是还
没来得及解决的实际问题,在我看来就是牛人,就是一个好的学者
【在 t****a 的大作中提到】
: 谢谢你的回复。
: 你说的那些应用都很promising。可是,建数据库,做in/del call的tools,或者做生
: 物学家交流用的网站,需要经过PhD训练的人做么?这样的事情看起来不过是计算机工
: 程学,没有发现新的知识,不是科学啊。
: 除了这些工程以外,生物信息学专业的人应该做什么事情才是“科学”呢?
y*j
83 楼
理论上就是没法分开。除非你真正的对某一个target做敲出啥的。
现在更多人开始重视动态,多个时间点的数据,但是这只不过是稍微好了一点点,时序
也不代表causality。
vs
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
现在更多人开始重视动态,多个时间点的数据,但是这只不过是稍微好了一点点,时序
也不代表causality。
vs
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
b*k
87 楼
我一直在想生物里big data到底有没有意义 想来想去觉得瓶颈是我们现在操纵生物现
象基本还是极低通量的技术:一次操纵一个蛋白/一个细胞/一群细胞/一群neuron,这
种级别的,而且时间空间精度都低的很(很多时候只有升高和降低这种根本无法定量的
概念),这种情况下高通量来的大数据很难有用武之地。可能得啥时候能编个程改变细
胞内/外一堆事件的时候大数据可能才能真的发挥作用。然而这个看起来似乎没啥希望
。。不说生物,就是物理化学现在也基本是操纵操纵单个事件而已
vs
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
象基本还是极低通量的技术:一次操纵一个蛋白/一个细胞/一群细胞/一群neuron,这
种级别的,而且时间空间精度都低的很(很多时候只有升高和降低这种根本无法定量的
概念),这种情况下高通量来的大数据很难有用武之地。可能得啥时候能编个程改变细
胞内/外一堆事件的时候大数据可能才能真的发挥作用。然而这个看起来似乎没啥希望
。。不说生物,就是物理化学现在也基本是操纵操纵单个事件而已
vs
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
b*r
91 楼
我觉得现在两者已经很难区分开来了
科学的发展已经几乎完全取决于工程学家所提供的工具的能力大小了。每次新发明一个
工具,大家就一起用它解决各个领域的问题,直到基本进入平台期,容易解决的问题都
被解决,然后大家一起进入低潮,等待下一个工具的诞生
不排除偶尔还是有奇才用老工具发现新的完全未知的东西,但是几率已经越来越低了,
现在的所谓牛人,诺贝尔奖,HHMI学者之类,一般都是那些能最快掌握新工具并且结合
到自己的工作中去的人。在这一点上生物和IT技术其实是平等的,你可以说是生物学家
在运用IT工作者的工具,也可以说是IT工作者应用了生物学家提供的信息和其他基础知
识,总之大家的目的是一样的,都是解决实际生活中的问题(求财),同时满足自己探
索未知(求知)的欲望
【在 y***j 的大作中提到】
: 工程和科学需要不同的方法,可能lz思维更属于喜欢搞科学的。
科学的发展已经几乎完全取决于工程学家所提供的工具的能力大小了。每次新发明一个
工具,大家就一起用它解决各个领域的问题,直到基本进入平台期,容易解决的问题都
被解决,然后大家一起进入低潮,等待下一个工具的诞生
不排除偶尔还是有奇才用老工具发现新的完全未知的东西,但是几率已经越来越低了,
现在的所谓牛人,诺贝尔奖,HHMI学者之类,一般都是那些能最快掌握新工具并且结合
到自己的工作中去的人。在这一点上生物和IT技术其实是平等的,你可以说是生物学家
在运用IT工作者的工具,也可以说是IT工作者应用了生物学家提供的信息和其他基础知
识,总之大家的目的是一样的,都是解决实际生活中的问题(求财),同时满足自己探
索未知(求知)的欲望
【在 y***j 的大作中提到】
: 工程和科学需要不同的方法,可能lz思维更属于喜欢搞科学的。
b*r
92 楼
光根据短期的相关关系就去炒股票,确实有一段时间这些人赚了,但是08年经济危机这
种特殊一点的情况一来,这些人不光老本,亏得祖宗八代的裤子都输掉了
当然了,这些人还有一招就是耍赖,结果纳税人的钱填了他们的大窟窿
【在 y****t 的大作中提到】
: 因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
: 靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
: 下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
: 。
: 但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
: 觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
: , 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
: 我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
:
: 文)
种特殊一点的情况一来,这些人不光老本,亏得祖宗八代的裤子都输掉了
当然了,这些人还有一招就是耍赖,结果纳税人的钱填了他们的大窟窿
【在 y****t 的大作中提到】
: 因果关系没有海量数据本来就是很难推理,如果只有一点点microarray数据,推理的可
: 靠性是大打折扣的。 现有的很多数学模型也都是建立在各种假设情况下的,仔细推敲
: 下,也说不清因果的。 生物里是有很多反馈机制,构成各种循环,更说不清楚因果了
: 。
: 但是bioinf可以让你发现一些肉眼看不出的相关关系来。 以前做股票期货的都是靠直
: 觉,靠经验,后来开始有些模型,在后来就大量出现informatics的,用电脑高频买卖
: , 把以前那些靠经验都打垮了。 没有谁真正需要知道因果的,发现相关就发财了。
: 我个人觉得能找到相关就很满足了。才不管是蛋生鸡,还是鸡生蛋这种哲学问题。
:
: 文)
y*j
94 楼
我感觉大部分时间还是挺清楚的吧。大的目的一样,但是职责和着眼点还是不一样吧。
科学家的目的是解释问题理论。我看的生物学(更倾向科学)都是说某一个现象如何解
释,他可以用最新的技术什么的,但是他的目不是技术而是现象本身。他可能改进了某
个技术,其实我们做实验找优化条件基本就算,但是这个技术是为了他的科学问题服务
的。就像我们学校的生物phd不能因为说你高出了一个比较新的protocol就让你毕业了
一样。
工程学家的目的是应用,我看的大部分生物信息学(倾向于工程)文章都是说有一堆数
据,我们想从事数据中知道某类的信息,所以基于某个assumption(这assumption应该
是由科学家证明过的,当然现在很多paper就是瞎拍脑袋出来个assuption)我们用了如
下算法,然后找一些数据,来验证他的算法是好的或者争取的。甚至比较新算法和老算
法之间的区别。他们并不真正的关注于算出来的具体结果如何解释生物问题。生物信息
的phd很多就是做了一个新的算法就可以毕业了。楼主说他生物背景弱大部分基本是在
工程方面发展,生物学家问问题,然后他帮忙想办法出个方法解决掉。
当然大牛跨在两个方面也是有的,但是就不是一般人能干的了。
【在 b****r 的大作中提到】
: 我觉得现在两者已经很难区分开来了
: 科学的发展已经几乎完全取决于工程学家所提供的工具的能力大小了。每次新发明一个
: 工具,大家就一起用它解决各个领域的问题,直到基本进入平台期,容易解决的问题都
: 被解决,然后大家一起进入低潮,等待下一个工具的诞生
: 不排除偶尔还是有奇才用老工具发现新的完全未知的东西,但是几率已经越来越低了,
: 现在的所谓牛人,诺贝尔奖,HHMI学者之类,一般都是那些能最快掌握新工具并且结合
: 到自己的工作中去的人。在这一点上生物和IT技术其实是平等的,你可以说是生物学家
: 在运用IT工作者的工具,也可以说是IT工作者应用了生物学家提供的信息和其他基础知
: 识,总之大家的目的是一样的,都是解决实际生活中的问题(求财),同时满足自己探
: 索未知(求知)的欲望
科学家的目的是解释问题理论。我看的生物学(更倾向科学)都是说某一个现象如何解
释,他可以用最新的技术什么的,但是他的目不是技术而是现象本身。他可能改进了某
个技术,其实我们做实验找优化条件基本就算,但是这个技术是为了他的科学问题服务
的。就像我们学校的生物phd不能因为说你高出了一个比较新的protocol就让你毕业了
一样。
工程学家的目的是应用,我看的大部分生物信息学(倾向于工程)文章都是说有一堆数
据,我们想从事数据中知道某类的信息,所以基于某个assumption(这assumption应该
是由科学家证明过的,当然现在很多paper就是瞎拍脑袋出来个assuption)我们用了如
下算法,然后找一些数据,来验证他的算法是好的或者争取的。甚至比较新算法和老算
法之间的区别。他们并不真正的关注于算出来的具体结果如何解释生物问题。生物信息
的phd很多就是做了一个新的算法就可以毕业了。楼主说他生物背景弱大部分基本是在
工程方面发展,生物学家问问题,然后他帮忙想办法出个方法解决掉。
当然大牛跨在两个方面也是有的,但是就不是一般人能干的了。
【在 b****r 的大作中提到】
: 我觉得现在两者已经很难区分开来了
: 科学的发展已经几乎完全取决于工程学家所提供的工具的能力大小了。每次新发明一个
: 工具,大家就一起用它解决各个领域的问题,直到基本进入平台期,容易解决的问题都
: 被解决,然后大家一起进入低潮,等待下一个工具的诞生
: 不排除偶尔还是有奇才用老工具发现新的完全未知的东西,但是几率已经越来越低了,
: 现在的所谓牛人,诺贝尔奖,HHMI学者之类,一般都是那些能最快掌握新工具并且结合
: 到自己的工作中去的人。在这一点上生物和IT技术其实是平等的,你可以说是生物学家
: 在运用IT工作者的工具,也可以说是IT工作者应用了生物学家提供的信息和其他基础知
: 识,总之大家的目的是一样的,都是解决实际生活中的问题(求财),同时满足自己探
: 索未知(求知)的欲望
s*a
95 楼
I wasn't talking about you.
楼主 = tninja
vs
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
楼主 = tninja
vs
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
s*a
98 楼
Read the papers before you cite them to support your statement, please.
It's not about the opinions, it's about how your derive the opinions.
I actually criticized some of these authors quite a bit when I reviewed a
recent manuscript of theirs. But one has to back it up with specific
evidences. Think it as a courtesy to your peers.
【在 t****a 的大作中提到】
: 感谢你务实的态度,把论文找出来供大家探讨,非常感谢
: 下面是我的拙见:
: 简单说来就是regulator信息+promoter based regulator predicting信息 +
: microarray correlation。
: 逻辑是,因为promoter based regulator是causality的,所以结果就是causality
: 的。microarray是用来帮助筛选的。
: 可是promoter based那些玩意,在高等生物里的预测准确度,大家应该都知道怎么回事
: ,对吧。在此基础上加上一个correlation来筛选,真的能找出可以拿去做实验验证的
: 东西么?
: 而且,这篇文章里的microarray,也没有起到帮助推导causality的作用,它就还是一
It's not about the opinions, it's about how your derive the opinions.
I actually criticized some of these authors quite a bit when I reviewed a
recent manuscript of theirs. But one has to back it up with specific
evidences. Think it as a courtesy to your peers.
【在 t****a 的大作中提到】
: 感谢你务实的态度,把论文找出来供大家探讨,非常感谢
: 下面是我的拙见:
: 简单说来就是regulator信息+promoter based regulator predicting信息 +
: microarray correlation。
: 逻辑是,因为promoter based regulator是causality的,所以结果就是causality
: 的。microarray是用来帮助筛选的。
: 可是promoter based那些玩意,在高等生物里的预测准确度,大家应该都知道怎么回事
: ,对吧。在此基础上加上一个correlation来筛选,真的能找出可以拿去做实验验证的
: 东西么?
: 而且,这篇文章里的microarray,也没有起到帮助推导causality的作用,它就还是一
t*a
99 楼
很赞同的你的看法,偏实践性质的计算机工程,只要把东西搞定就行,和生物科学里关
注发现并验证新知识,甚至上升到假说层面并验证,是不太一样的 (当然计算机理论
研究也有些很fancy的东西,那是另外一个问题)。从政府的角度出发,他们给funding
的目的是希望在科学上发展,工程在这里是铺路搭桥的。
【在 y***j 的大作中提到】
: 我感觉大部分时间还是挺清楚的吧。大的目的一样,但是职责和着眼点还是不一样吧。
: 科学家的目的是解释问题理论。我看的生物学(更倾向科学)都是说某一个现象如何解
: 释,他可以用最新的技术什么的,但是他的目不是技术而是现象本身。他可能改进了某
: 个技术,其实我们做实验找优化条件基本就算,但是这个技术是为了他的科学问题服务
: 的。就像我们学校的生物phd不能因为说你高出了一个比较新的protocol就让你毕业了
: 一样。
: 工程学家的目的是应用,我看的大部分生物信息学(倾向于工程)文章都是说有一堆数
: 据,我们想从事数据中知道某类的信息,所以基于某个assumption(这assumption应该
: 是由科学家证明过的,当然现在很多paper就是瞎拍脑袋出来个assuption)我们用了如
: 下算法,然后找一些数据,来验证他的算法是好的或者争取的。甚至比较新算法和老算
注发现并验证新知识,甚至上升到假说层面并验证,是不太一样的 (当然计算机理论
研究也有些很fancy的东西,那是另外一个问题)。从政府的角度出发,他们给funding
的目的是希望在科学上发展,工程在这里是铺路搭桥的。
【在 y***j 的大作中提到】
: 我感觉大部分时间还是挺清楚的吧。大的目的一样,但是职责和着眼点还是不一样吧。
: 科学家的目的是解释问题理论。我看的生物学(更倾向科学)都是说某一个现象如何解
: 释,他可以用最新的技术什么的,但是他的目不是技术而是现象本身。他可能改进了某
: 个技术,其实我们做实验找优化条件基本就算,但是这个技术是为了他的科学问题服务
: 的。就像我们学校的生物phd不能因为说你高出了一个比较新的protocol就让你毕业了
: 一样。
: 工程学家的目的是应用,我看的大部分生物信息学(倾向于工程)文章都是说有一堆数
: 据,我们想从事数据中知道某类的信息,所以基于某个assumption(这assumption应该
: 是由科学家证明过的,当然现在很多paper就是瞎拍脑袋出来个assuption)我们用了如
: 下算法,然后找一些数据,来验证他的算法是好的或者争取的。甚至比较新算法和老算
t*a
100 楼
接受你的批评和建议,谢谢。
【在 s******a 的大作中提到】
: Read the papers before you cite them to support your statement, please.
: It's not about the opinions, it's about how your derive the opinions.
: I actually criticized some of these authors quite a bit when I reviewed a
: recent manuscript of theirs. But one has to back it up with specific
: evidences. Think it as a courtesy to your peers.
【在 s******a 的大作中提到】
: Read the papers before you cite them to support your statement, please.
: It's not about the opinions, it's about how your derive the opinions.
: I actually criticized some of these authors quite a bit when I reviewed a
: recent manuscript of theirs. But one has to back it up with specific
: evidences. Think it as a courtesy to your peers.
c*0
104 楼
生信作为发文来说还是前途无量的...
Eric Lander和Mary Claire King随便吵吵都是上CNS,PNAS的料...
Eric Lander和Mary Claire King随便吵吵都是上CNS,PNAS的料...
b*r
107 楼
这种预测,说白了还是一种凭经验做事的方法,知其然不知其所以然,只好退而求其次
。现在看起来fancy一点,只不过是用电脑和数学把经验总结得更细致一点,但是只要
实际情况稍微超过一点已经经历过的时代,整个模型就变成了bullshit,比如我刚举的
08危机的例子
最理想也最朴素地解决问题的办法,只有一个,就是搞清楚背后真正的原理,只有实在
做不到这一点,才去总结经验搞什么数学建模
【在 t****a 的大作中提到】
: 我觉得根据相关去做预测本身没有问题啊,道理上说得通,在工程上是好用的,反正大
: 家不管细节如何,好使就行。最简单的例子就是google的search engine,那就是相关
: ,用big user behavior data mining做出来,大家都觉得有用。
。现在看起来fancy一点,只不过是用电脑和数学把经验总结得更细致一点,但是只要
实际情况稍微超过一点已经经历过的时代,整个模型就变成了bullshit,比如我刚举的
08危机的例子
最理想也最朴素地解决问题的办法,只有一个,就是搞清楚背后真正的原理,只有实在
做不到这一点,才去总结经验搞什么数学建模
【在 t****a 的大作中提到】
: 我觉得根据相关去做预测本身没有问题啊,道理上说得通,在工程上是好用的,反正大
: 家不管细节如何,好使就行。最简单的例子就是google的search engine,那就是相关
: ,用big user behavior data mining做出来,大家都觉得有用。
b*r
108 楼
你说的我基本同意
但是在现实生活中,即使是工程方面的文章,做出一个新工具,也还是要尝试着去解决
一个所谓的生物学问题,哪怕这个问题在真正的生物学家看来根本不成立
总之我觉得没有必要把两者分得太清楚,大家的目的都是一个,就是解决问题,大家离
了谁都干不好,大家各有所长,一起合作把问题解决了,这是干这行的终极目的
【在 y***j 的大作中提到】
: 我感觉大部分时间还是挺清楚的吧。大的目的一样,但是职责和着眼点还是不一样吧。
: 科学家的目的是解释问题理论。我看的生物学(更倾向科学)都是说某一个现象如何解
: 释,他可以用最新的技术什么的,但是他的目不是技术而是现象本身。他可能改进了某
: 个技术,其实我们做实验找优化条件基本就算,但是这个技术是为了他的科学问题服务
: 的。就像我们学校的生物phd不能因为说你高出了一个比较新的protocol就让你毕业了
: 一样。
: 工程学家的目的是应用,我看的大部分生物信息学(倾向于工程)文章都是说有一堆数
: 据,我们想从事数据中知道某类的信息,所以基于某个assumption(这assumption应该
: 是由科学家证明过的,当然现在很多paper就是瞎拍脑袋出来个assuption)我们用了如
: 下算法,然后找一些数据,来验证他的算法是好的或者争取的。甚至比较新算法和老算
但是在现实生活中,即使是工程方面的文章,做出一个新工具,也还是要尝试着去解决
一个所谓的生物学问题,哪怕这个问题在真正的生物学家看来根本不成立
总之我觉得没有必要把两者分得太清楚,大家的目的都是一个,就是解决问题,大家离
了谁都干不好,大家各有所长,一起合作把问题解决了,这是干这行的终极目的
【在 y***j 的大作中提到】
: 我感觉大部分时间还是挺清楚的吧。大的目的一样,但是职责和着眼点还是不一样吧。
: 科学家的目的是解释问题理论。我看的生物学(更倾向科学)都是说某一个现象如何解
: 释,他可以用最新的技术什么的,但是他的目不是技术而是现象本身。他可能改进了某
: 个技术,其实我们做实验找优化条件基本就算,但是这个技术是为了他的科学问题服务
: 的。就像我们学校的生物phd不能因为说你高出了一个比较新的protocol就让你毕业了
: 一样。
: 工程学家的目的是应用,我看的大部分生物信息学(倾向于工程)文章都是说有一堆数
: 据,我们想从事数据中知道某类的信息,所以基于某个assumption(这assumption应该
: 是由科学家证明过的,当然现在很多paper就是瞎拍脑袋出来个assuption)我们用了如
: 下算法,然后找一些数据,来验证他的算法是好的或者争取的。甚至比较新算法和老算
b*r
109 楼
什么叫做短期什么叫做长期呢
我刚才说了,那些用杠杆玩股票的人,这一把输掉的钱几辈子也还不清,你再长期搞,
能有多长期,能计算几百年的东西吗
其实有个挺常用的例子我感觉比较符合这些股市赌徒的情况,就是比大小,每比一次就
把赌本加一倍,按照经验来说,似乎是稳赚不赔的,哪怕赌到第一百次才赢一次,貌似
还是赚了。但是只要清楚背后的原理,就知道这种貌似非常灵验的经验根本就是错误的
,如果现实生活中撑不到继续赌本加倍的一天,将导致毁灭性的打击,不光搞死自己,
还会连累无数的人
所以归根结底,科学的目的还是搞清楚所以然,而把绝对不是将经验奉为圭璞,只知道
用蛮力不明就里地去总结已有的那么一点经验。某些人进一步认为用了某种数学去总结
经验就牛x了,更是荒唐得可笑
【在 y***j 的大作中提到】
: 根据短期相关做出来的关系只当然只对短期相关有指导意义,这段时间赔钱了,只要比
: 一般人赔的少,就证明他的模型还是有用的。
: 长期相关性应该有其他的模型来算吧。
: 短期相关后面还是有一定的理论基础的,基本上就是在股市后面运行的人性,模型只不
: 过是想办法把群体表现出的人性量化的反映出来。
我刚才说了,那些用杠杆玩股票的人,这一把输掉的钱几辈子也还不清,你再长期搞,
能有多长期,能计算几百年的东西吗
其实有个挺常用的例子我感觉比较符合这些股市赌徒的情况,就是比大小,每比一次就
把赌本加一倍,按照经验来说,似乎是稳赚不赔的,哪怕赌到第一百次才赢一次,貌似
还是赚了。但是只要清楚背后的原理,就知道这种貌似非常灵验的经验根本就是错误的
,如果现实生活中撑不到继续赌本加倍的一天,将导致毁灭性的打击,不光搞死自己,
还会连累无数的人
所以归根结底,科学的目的还是搞清楚所以然,而把绝对不是将经验奉为圭璞,只知道
用蛮力不明就里地去总结已有的那么一点经验。某些人进一步认为用了某种数学去总结
经验就牛x了,更是荒唐得可笑
【在 y***j 的大作中提到】
: 根据短期相关做出来的关系只当然只对短期相关有指导意义,这段时间赔钱了,只要比
: 一般人赔的少,就证明他的模型还是有用的。
: 长期相关性应该有其他的模型来算吧。
: 短期相关后面还是有一定的理论基础的,基本上就是在股市后面运行的人性,模型只不
: 过是想办法把群体表现出的人性量化的反映出来。
b*k
110 楼
你这个例子恰好说明玩股票失误的是杠杆率太高 而不是它们的model真的有
substantial problem吧
【在 b****r 的大作中提到】
: 什么叫做短期什么叫做长期呢
: 我刚才说了,那些用杠杆玩股票的人,这一把输掉的钱几辈子也还不清,你再长期搞,
: 能有多长期,能计算几百年的东西吗
: 其实有个挺常用的例子我感觉比较符合这些股市赌徒的情况,就是比大小,每比一次就
: 把赌本加一倍,按照经验来说,似乎是稳赚不赔的,哪怕赌到第一百次才赢一次,貌似
: 还是赚了。但是只要清楚背后的原理,就知道这种貌似非常灵验的经验根本就是错误的
: ,如果现实生活中撑不到继续赌本加倍的一天,将导致毁灭性的打击,不光搞死自己,
: 还会连累无数的人
: 所以归根结底,科学的目的还是搞清楚所以然,而把绝对不是将经验奉为圭璞,只知道
: 用蛮力不明就里地去总结已有的那么一点经验。某些人进一步认为用了某种数学去总结
substantial problem吧
【在 b****r 的大作中提到】
: 什么叫做短期什么叫做长期呢
: 我刚才说了,那些用杠杆玩股票的人,这一把输掉的钱几辈子也还不清,你再长期搞,
: 能有多长期,能计算几百年的东西吗
: 其实有个挺常用的例子我感觉比较符合这些股市赌徒的情况,就是比大小,每比一次就
: 把赌本加一倍,按照经验来说,似乎是稳赚不赔的,哪怕赌到第一百次才赢一次,貌似
: 还是赚了。但是只要清楚背后的原理,就知道这种貌似非常灵验的经验根本就是错误的
: ,如果现实生活中撑不到继续赌本加倍的一天,将导致毁灭性的打击,不光搞死自己,
: 还会连累无数的人
: 所以归根结底,科学的目的还是搞清楚所以然,而把绝对不是将经验奉为圭璞,只知道
: 用蛮力不明就里地去总结已有的那么一点经验。某些人进一步认为用了某种数学去总结
b*r
111 楼
我不太同意。真正对一个target进行敲除,然后用贝叶斯方法,以我有限的数学知识,
确实还是有可能搞清楚一部分因果关系。在很多系统,对target进行敲除本来就是极为
常规的办法。
所以理论上来说,做这些工作确实是能够帮助解决问题的,但是性价比到底如何呢。反
正在我看来,对于人体这么复杂噪音这么多的系统,用这种方法去硬解问题,简直是自
寻死路,除非你的目的不是解决现实问题,而是去骗那些不够聪明的基金委员会的钱。
再等20年等计算机技术和生物学技术再上升几个指数级的时候,可能以此方向为职业还
过得去
【在 y***j 的大作中提到】
: 理论上就是没法分开。除非你真正的对某一个target做敲出啥的。
: 现在更多人开始重视动态,多个时间点的数据,但是这只不过是稍微好了一点点,时序
: 也不代表causality。
:
: vs
确实还是有可能搞清楚一部分因果关系。在很多系统,对target进行敲除本来就是极为
常规的办法。
所以理论上来说,做这些工作确实是能够帮助解决问题的,但是性价比到底如何呢。反
正在我看来,对于人体这么复杂噪音这么多的系统,用这种方法去硬解问题,简直是自
寻死路,除非你的目的不是解决现实问题,而是去骗那些不够聪明的基金委员会的钱。
再等20年等计算机技术和生物学技术再上升几个指数级的时候,可能以此方向为职业还
过得去
【在 y***j 的大作中提到】
: 理论上就是没法分开。除非你真正的对某一个target做敲出啥的。
: 现在更多人开始重视动态,多个时间点的数据,但是这只不过是稍微好了一点点,时序
: 也不代表causality。
:
: vs
b*k
113 楼
实际上问题就是各家的model都是基于市场交易情况长期稳定的假设的,买/沽在此前提
下一般能实现风险最小化。如果市场有短时间剧烈动荡那就完蛋了
同时由于各家model互相不公开,理论上是没办法把这个正反馈给弄没的。。金融危机
里逃过一劫的fund要么是杠杆率很低,要么是带有浓厚个人色彩的投资者(不完全依赖
model)。
【在 H*******i 的大作中提到】
: 如果把整个系统放在杠杆上玩呢?利用各种信息不对称和似是而非的理论搞一堆工具。
: 比如有99.9%可能获得0.01%的收益,有0.01%损失99.9%的钱。
: 在很长时间内都是看似赚钱的,利用杠杆操控资金,但一次爆仓就结束了,然后赚的钱
: 是自己的,赔得钱就是别人的。
: 还有就是经济学model怎么消除自身的自反馈?
下一般能实现风险最小化。如果市场有短时间剧烈动荡那就完蛋了
同时由于各家model互相不公开,理论上是没办法把这个正反馈给弄没的。。金融危机
里逃过一劫的fund要么是杠杆率很低,要么是带有浓厚个人色彩的投资者(不完全依赖
model)。
【在 H*******i 的大作中提到】
: 如果把整个系统放在杠杆上玩呢?利用各种信息不对称和似是而非的理论搞一堆工具。
: 比如有99.9%可能获得0.01%的收益,有0.01%损失99.9%的钱。
: 在很长时间内都是看似赚钱的,利用杠杆操控资金,但一次爆仓就结束了,然后赚的钱
: 是自己的,赔得钱就是别人的。
: 还有就是经济学model怎么消除自身的自反馈?
b*r
114 楼
这个model当然有substantial problem,problem正是使用者和监管者不知道或者装作
不知道其局限性和危险性
事实上为了盈利而用model去炒股票,而不是根据股票内在价值去真正投资,这个本身
就是一种极其荒谬的做法,完全背离了股市的本意。这种行为本质而言不会创造任何财
富,对于整个社会而言只会浪费金钱和人力,只不过太多人都被眼前利益的幻像迷惑了
双眼,放弃了自我思考。
或者再简单一点的说,这就好比打麻将最厉害的那个人确实发大财了,结果全民都不去
做事,而一起研究如何打好麻将。打麻将在这里对应的就是用数学模型炒股的行为
【在 b******k 的大作中提到】
: 你这个例子恰好说明玩股票失误的是杠杆率太高 而不是它们的model真的有
: substantial problem吧
不知道其局限性和危险性
事实上为了盈利而用model去炒股票,而不是根据股票内在价值去真正投资,这个本身
就是一种极其荒谬的做法,完全背离了股市的本意。这种行为本质而言不会创造任何财
富,对于整个社会而言只会浪费金钱和人力,只不过太多人都被眼前利益的幻像迷惑了
双眼,放弃了自我思考。
或者再简单一点的说,这就好比打麻将最厉害的那个人确实发大财了,结果全民都不去
做事,而一起研究如何打好麻将。打麻将在这里对应的就是用数学模型炒股的行为
【在 b******k 的大作中提到】
: 你这个例子恰好说明玩股票失误的是杠杆率太高 而不是它们的model真的有
: substantial problem吧
b*k
115 楼
我说的substantial problem是专指model本身的validity而言 不涉及到道德判断。至
于股市的“本意”,这根本不是投资人需要关心的问题
【在 b****r 的大作中提到】
: 这个model当然有substantial problem,problem正是使用者和监管者不知道或者装作
: 不知道其局限性和危险性
: 事实上为了盈利而用model去炒股票,而不是根据股票内在价值去真正投资,这个本身
: 就是一种极其荒谬的做法,完全背离了股市的本意。这种行为本质而言不会创造任何财
: 富,对于整个社会而言只会浪费金钱和人力,只不过太多人都被眼前利益的幻像迷惑了
: 双眼,放弃了自我思考。
: 或者再简单一点的说,这就好比打麻将最厉害的那个人确实发大财了,结果全民都不去
: 做事,而一起研究如何打好麻将。打麻将在这里对应的就是用数学模型炒股的行为
于股市的“本意”,这根本不是投资人需要关心的问题
【在 b****r 的大作中提到】
: 这个model当然有substantial problem,problem正是使用者和监管者不知道或者装作
: 不知道其局限性和危险性
: 事实上为了盈利而用model去炒股票,而不是根据股票内在价值去真正投资,这个本身
: 就是一种极其荒谬的做法,完全背离了股市的本意。这种行为本质而言不会创造任何财
: 富,对于整个社会而言只会浪费金钱和人力,只不过太多人都被眼前利益的幻像迷惑了
: 双眼,放弃了自我思考。
: 或者再简单一点的说,这就好比打麻将最厉害的那个人确实发大财了,结果全民都不去
: 做事,而一起研究如何打好麻将。打麻将在这里对应的就是用数学模型炒股的行为
b*k
117 楼
我说的validity是说模型的功效没有问题,至于模型的使用边界(比如遇到08那样的情
况的话)也是不得不接受的局限性之一,不管谁怎么来投资都有局限性。这个和用数学
模型投资与否就没什么关系。建立在模型上的investor是有很多赔了底朝天,难道08的
时候不用模型的都一定不赔底朝天了?不说机构投资者了,小散08年破产了多少?小散
难道也用了model了?
至于该不该投资这样的股市,或者监管机构该不该允许这样的股市交易存在,还是那句
话,不是单个投资者需要考虑的问题。在合法范围内最大化投资者的收益才是他们需要
考虑的。
【在 b****r 的大作中提到】
: 我觉得我说得已经够清楚了,把一个model用到不合适的地方,当然就不valid了,这也
: 正是现实生活中已经发生了的。如果你说的validity是运算过程中有没有算错,那你当
: 我没说吧
: 另外事实上投资人使用这类model相当一部分赔了个底朝天,若干年积蓄一夜蒸发,你
: 觉得他们不需要关心这个问题?我觉得他们甚至应该关心一下是不是该把自己的血汗钱
: 继续投到这样的股市去。反正我是不会这么干的
况的话)也是不得不接受的局限性之一,不管谁怎么来投资都有局限性。这个和用数学
模型投资与否就没什么关系。建立在模型上的investor是有很多赔了底朝天,难道08的
时候不用模型的都一定不赔底朝天了?不说机构投资者了,小散08年破产了多少?小散
难道也用了model了?
至于该不该投资这样的股市,或者监管机构该不该允许这样的股市交易存在,还是那句
话,不是单个投资者需要考虑的问题。在合法范围内最大化投资者的收益才是他们需要
考虑的。
【在 b****r 的大作中提到】
: 我觉得我说得已经够清楚了,把一个model用到不合适的地方,当然就不valid了,这也
: 正是现实生活中已经发生了的。如果你说的validity是运算过程中有没有算错,那你当
: 我没说吧
: 另外事实上投资人使用这类model相当一部分赔了个底朝天,若干年积蓄一夜蒸发,你
: 觉得他们不需要关心这个问题?我觉得他们甚至应该关心一下是不是该把自己的血汗钱
: 继续投到这样的股市去。反正我是不会这么干的
l*o
118 楼
现在生物学研究的一大贡献是向各领域输出了大量人才:)
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
d*l
119 楼
我觉得现在的生物医学研究已经离不开bioinformatics,每个生物ph.D. student and
postdoc都应该会perl/python, R, bioconductor, machine learning, data mining的
基本算法。现在的问题是生物体这么复杂的系统,现在的数据量还远不够reverse
engineer它。这是数据的问题,不是算法的问题。
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
postdoc都应该会perl/python, R, bioconductor, machine learning, data mining的
基本算法。现在的问题是生物体这么复杂的系统,现在的数据量还远不够reverse
engineer它。这是数据的问题,不是算法的问题。
文)
contribution?
【在 t****a 的大作中提到】
: 一个困惑我很久的问题,就是用高通量手段诸如microarray, sequencing,蛋白质普之
: 类的手段做生物信息研究,到底在生物研究中处于一个什么样地位的问题。
: 我做PhD的那些年,计算领域出现各种在这些数据上进行非常fancy的建模,推理的算法
: ,能够得到一些很高层次诸如regulator network的结果(比如eran segal的一堆论文)
: 读了一些哲学相关的书以后,我对这些东西逐渐从相信变得怀疑,最终变得否定。因为
: 他们混淆了相关和因果。
: 既然这些高通量方法并不能帮助进行深层次的推理,它是否就仅仅实现了高通量筛选的
: 过程?做为计算科学家在这个领域是否最大的用处就仅仅是开发些类blast tool,做点
: R/python package,搞点database,做点网站?我们在哪里可以有最大的contribution?
: 希望有朋友来回答,谢谢
y*j
121 楼
短期长期当然是看模型本身,每个模型都有适用的范围。如果你给他一个不在模型以内
的扰动模型肯定失败。你说的08年并不能证明模型不好,只能当时不适用罢了。想想名
言:all models are wrong,but some are useful
我前面说了很多股票模型背后其实还是有理论支持的,就算最简单头肩的形状后面也有
人性
的支持的。
【在 b****r 的大作中提到】
: 什么叫做短期什么叫做长期呢
: 我刚才说了,那些用杠杆玩股票的人,这一把输掉的钱几辈子也还不清,你再长期搞,
: 能有多长期,能计算几百年的东西吗
: 其实有个挺常用的例子我感觉比较符合这些股市赌徒的情况,就是比大小,每比一次就
: 把赌本加一倍,按照经验来说,似乎是稳赚不赔的,哪怕赌到第一百次才赢一次,貌似
: 还是赚了。但是只要清楚背后的原理,就知道这种貌似非常灵验的经验根本就是错误的
: ,如果现实生活中撑不到继续赌本加倍的一天,将导致毁灭性的打击,不光搞死自己,
: 还会连累无数的人
: 所以归根结底,科学的目的还是搞清楚所以然,而把绝对不是将经验奉为圭璞,只知道
: 用蛮力不明就里地去总结已有的那么一点经验。某些人进一步认为用了某种数学去总结
的扰动模型肯定失败。你说的08年并不能证明模型不好,只能当时不适用罢了。想想名
言:all models are wrong,but some are useful
我前面说了很多股票模型背后其实还是有理论支持的,就算最简单头肩的形状后面也有
人性
的支持的。
【在 b****r 的大作中提到】
: 什么叫做短期什么叫做长期呢
: 我刚才说了,那些用杠杆玩股票的人,这一把输掉的钱几辈子也还不清,你再长期搞,
: 能有多长期,能计算几百年的东西吗
: 其实有个挺常用的例子我感觉比较符合这些股市赌徒的情况,就是比大小,每比一次就
: 把赌本加一倍,按照经验来说,似乎是稳赚不赔的,哪怕赌到第一百次才赢一次,貌似
: 还是赚了。但是只要清楚背后的原理,就知道这种貌似非常灵验的经验根本就是错误的
: ,如果现实生活中撑不到继续赌本加倍的一天,将导致毁灭性的打击,不光搞死自己,
: 还会连累无数的人
: 所以归根结底,科学的目的还是搞清楚所以然,而把绝对不是将经验奉为圭璞,只知道
: 用蛮力不明就里地去总结已有的那么一点经验。某些人进一步认为用了某种数学去总结
y*j
122 楼
没看懂你不同意什么地方。
我不就是说现在的数据没法做因果关系么?
【在 b****r 的大作中提到】
: 我不太同意。真正对一个target进行敲除,然后用贝叶斯方法,以我有限的数学知识,
: 确实还是有可能搞清楚一部分因果关系。在很多系统,对target进行敲除本来就是极为
: 常规的办法。
: 所以理论上来说,做这些工作确实是能够帮助解决问题的,但是性价比到底如何呢。反
: 正在我看来,对于人体这么复杂噪音这么多的系统,用这种方法去硬解问题,简直是自
: 寻死路,除非你的目的不是解决现实问题,而是去骗那些不够聪明的基金委员会的钱。
: 再等20年等计算机技术和生物学技术再上升几个指数级的时候,可能以此方向为职业还
: 过得去
我不就是说现在的数据没法做因果关系么?
【在 b****r 的大作中提到】
: 我不太同意。真正对一个target进行敲除,然后用贝叶斯方法,以我有限的数学知识,
: 确实还是有可能搞清楚一部分因果关系。在很多系统,对target进行敲除本来就是极为
: 常规的办法。
: 所以理论上来说,做这些工作确实是能够帮助解决问题的,但是性价比到底如何呢。反
: 正在我看来,对于人体这么复杂噪音这么多的系统,用这种方法去硬解问题,简直是自
: 寻死路,除非你的目的不是解决现实问题,而是去骗那些不够聪明的基金委员会的钱。
: 再等20年等计算机技术和生物学技术再上升几个指数级的时候,可能以此方向为职业还
: 过得去
y*j
124 楼
你说的太人被眼前利益迷惑,据我所知就是股市上很多model的内在的基础。
根据股票实际价值的估值,据我所知也有类似的一些model,但是具体我不是专业的,
只是听朋友喝酒聊天时候说过,不太清楚。但是这个东西对中长线有用,但是对短线就
没有什么用了。
而那些靠着形状的model一般对短线有用但是对中长线是用处不大了。
所谓不同的情况下需要不同的model,永远不要企盼有什么一个能fit一切的model。
btw:为啥跑题跑得这么远,生物信息学有啥用跑到炒股票人品不好?
【在 b****r 的大作中提到】
: 这个model当然有substantial problem,problem正是使用者和监管者不知道或者装作
: 不知道其局限性和危险性
: 事实上为了盈利而用model去炒股票,而不是根据股票内在价值去真正投资,这个本身
: 就是一种极其荒谬的做法,完全背离了股市的本意。这种行为本质而言不会创造任何财
: 富,对于整个社会而言只会浪费金钱和人力,只不过太多人都被眼前利益的幻像迷惑了
: 双眼,放弃了自我思考。
: 或者再简单一点的说,这就好比打麻将最厉害的那个人确实发大财了,结果全民都不去
: 做事,而一起研究如何打好麻将。打麻将在这里对应的就是用数学模型炒股的行为
根据股票实际价值的估值,据我所知也有类似的一些model,但是具体我不是专业的,
只是听朋友喝酒聊天时候说过,不太清楚。但是这个东西对中长线有用,但是对短线就
没有什么用了。
而那些靠着形状的model一般对短线有用但是对中长线是用处不大了。
所谓不同的情况下需要不同的model,永远不要企盼有什么一个能fit一切的model。
btw:为啥跑题跑得这么远,生物信息学有啥用跑到炒股票人品不好?
【在 b****r 的大作中提到】
: 这个model当然有substantial problem,problem正是使用者和监管者不知道或者装作
: 不知道其局限性和危险性
: 事实上为了盈利而用model去炒股票,而不是根据股票内在价值去真正投资,这个本身
: 就是一种极其荒谬的做法,完全背离了股市的本意。这种行为本质而言不会创造任何财
: 富,对于整个社会而言只会浪费金钱和人力,只不过太多人都被眼前利益的幻像迷惑了
: 双眼,放弃了自我思考。
: 或者再简单一点的说,这就好比打麻将最厉害的那个人确实发大财了,结果全民都不去
: 做事,而一起研究如何打好麻将。打麻将在这里对应的就是用数学模型炒股的行为
y*j
125 楼
不知道你有多了解股市,我完全不懂经济,我也完全不炒股,但是我有很多学经济的朋
友,常常聊一些这些东西。
我前面说了股市的model好处是理论上你比随机好一点理论上就能跑赢大盘。美国大部
分基金跑不赢指数的(我没查具体数据,朋友说的,如果有错可以指出来),说明什么
?即使
专业的人,搞不过随机买卖。也就是你只要预测的正确率大于随机的50%,(不考虑
税费等等)你就会跑赢大盘,比大部分人干的好。
回到生物医学领域,你是受不了这么低的正确率的。
另外,你总说什么一次投资赔得光屁股,成熟地股手是不会把所有篮子放在同一个鸡蛋
里的,而且他们有着自己严格的止损线,不是这么容易输得光屁股的。真的输光了屁股
那就跟大环境有关了,不是model不model的问题了,覆巢之下安有完卵?
【在 b****r 的大作中提到】
: 我觉得我说得已经够清楚了,把一个model用到不合适的地方,当然就不valid了,这也
: 正是现实生活中已经发生了的。如果你说的validity是运算过程中有没有算错,那你当
: 我没说吧
: 另外事实上投资人使用这类model相当一部分赔了个底朝天,若干年积蓄一夜蒸发,你
: 觉得他们不需要关心这个问题?我觉得他们甚至应该关心一下是不是该把自己的血汗钱
: 继续投到这样的股市去。反正我是不会这么干的
友,常常聊一些这些东西。
我前面说了股市的model好处是理论上你比随机好一点理论上就能跑赢大盘。美国大部
分基金跑不赢指数的(我没查具体数据,朋友说的,如果有错可以指出来),说明什么
?即使
专业的人,搞不过随机买卖。也就是你只要预测的正确率大于随机的50%,(不考虑
税费等等)你就会跑赢大盘,比大部分人干的好。
回到生物医学领域,你是受不了这么低的正确率的。
另外,你总说什么一次投资赔得光屁股,成熟地股手是不会把所有篮子放在同一个鸡蛋
里的,而且他们有着自己严格的止损线,不是这么容易输得光屁股的。真的输光了屁股
那就跟大环境有关了,不是model不model的问题了,覆巢之下安有完卵?
【在 b****r 的大作中提到】
: 我觉得我说得已经够清楚了,把一个model用到不合适的地方,当然就不valid了,这也
: 正是现实生活中已经发生了的。如果你说的validity是运算过程中有没有算错,那你当
: 我没说吧
: 另外事实上投资人使用这类model相当一部分赔了个底朝天,若干年积蓄一夜蒸发,你
: 觉得他们不需要关心这个问题?我觉得他们甚至应该关心一下是不是该把自己的血汗钱
: 继续投到这样的股市去。反正我是不会这么干的
c*r
126 楼
说到底是因为复杂非线性系统靠modelling根本无法实现传统的“预测”功能,连预测
概率都没办法在long-term上保证精确度。所有试图“预测”的都是白费工夫。
推荐 Stuart Kauffmann的文章,比如这个:http://arxiv.org/abs/1201.2069
概率都没办法在long-term上保证精确度。所有试图“预测”的都是白费工夫。
推荐 Stuart Kauffmann的文章,比如这个:http://arxiv.org/abs/1201.2069
b*r
127 楼
我的观点是研究怎么用model炒股就像研究怎么打麻将赢钱一样,对于社会来说是非常
消极的负面的一种行为,不创造财富,只转移和消耗财富
当然,如果你就是对打麻将有兴趣也能靠牌技高超从低手口袋里掏钱谋生甚至致富,我
也不会去攻击你,我自己不会去做这种事情而已
另外,生物甚至临床医学里提高百分之几的概率,有时候不光会被接受,甚至可以导致
一些人一夜暴富,更甚至可以造就一个新的行业。打个比方,近年兴起的个体化肿瘤用
药,其实也就是能在大规模统计学研究中稍微提高患者的生存率,还没有哪个药真能把
哪个恶性肿瘤从没治变有治
【在 y***j 的大作中提到】
: 不知道你有多了解股市,我完全不懂经济,我也完全不炒股,但是我有很多学经济的朋
: 友,常常聊一些这些东西。
: 我前面说了股市的model好处是理论上你比随机好一点理论上就能跑赢大盘。美国大部
: 分基金跑不赢指数的(我没查具体数据,朋友说的,如果有错可以指出来),说明什么
: ?即使
: 专业的人,搞不过随机买卖。也就是你只要预测的正确率大于随机的50%,(不考虑
: 税费等等)你就会跑赢大盘,比大部分人干的好。
: 回到生物医学领域,你是受不了这么低的正确率的。
: 另外,你总说什么一次投资赔得光屁股,成熟地股手是不会把所有篮子放在同一个鸡蛋
: 里的,而且他们有着自己严格的止损线,不是这么容易输得光屁股的。真的输光了屁股
消极的负面的一种行为,不创造财富,只转移和消耗财富
当然,如果你就是对打麻将有兴趣也能靠牌技高超从低手口袋里掏钱谋生甚至致富,我
也不会去攻击你,我自己不会去做这种事情而已
另外,生物甚至临床医学里提高百分之几的概率,有时候不光会被接受,甚至可以导致
一些人一夜暴富,更甚至可以造就一个新的行业。打个比方,近年兴起的个体化肿瘤用
药,其实也就是能在大规模统计学研究中稍微提高患者的生存率,还没有哪个药真能把
哪个恶性肿瘤从没治变有治
【在 y***j 的大作中提到】
: 不知道你有多了解股市,我完全不懂经济,我也完全不炒股,但是我有很多学经济的朋
: 友,常常聊一些这些东西。
: 我前面说了股市的model好处是理论上你比随机好一点理论上就能跑赢大盘。美国大部
: 分基金跑不赢指数的(我没查具体数据,朋友说的,如果有错可以指出来),说明什么
: ?即使
: 专业的人,搞不过随机买卖。也就是你只要预测的正确率大于随机的50%,(不考虑
: 税费等等)你就会跑赢大盘,比大部分人干的好。
: 回到生物医学领域,你是受不了这么低的正确率的。
: 另外,你总说什么一次投资赔得光屁股,成熟地股手是不会把所有篮子放在同一个鸡蛋
: 里的,而且他们有着自己严格的止损线,不是这么容易输得光屁股的。真的输光了屁股
b*1
130 楼
You can not become an excellent bioinformatics scientist if you are still
focusing on a paper published 10 years ago. Every 3-5 years, there is a
revolution on the type of experiments and magnitude of data generated. From
proteomics to transcriptome, RNA-Seq, exome, whole genome sequencing, to
ENCODE, an excellent scientist always follow the data, and think a few
years ahead of the crowd. Many of you think that NGS is a hot area. Last
year, there is only tens of genome in my database; this year, there are over
10,000 genomes across tens of diseases; Next year, UK just announced a
project to sequence 100,000 genome. In several years, we will have millions
of genomes linked with electronic medical records. With such an amazing
amount of data, any of you here can investigate and find disease mechanisms/
biomarkers/drug targets/drugs using the most basic method.
Data is frozen knowledge, waiting for us to discover.....
focusing on a paper published 10 years ago. Every 3-5 years, there is a
revolution on the type of experiments and magnitude of data generated. From
proteomics to transcriptome, RNA-Seq, exome, whole genome sequencing, to
ENCODE, an excellent scientist always follow the data, and think a few
years ahead of the crowd. Many of you think that NGS is a hot area. Last
year, there is only tens of genome in my database; this year, there are over
10,000 genomes across tens of diseases; Next year, UK just announced a
project to sequence 100,000 genome. In several years, we will have millions
of genomes linked with electronic medical records. With such an amazing
amount of data, any of you here can investigate and find disease mechanisms/
biomarkers/drug targets/drugs using the most basic method.
Data is frozen knowledge, waiting for us to discover.....
y*j
131 楼
只是前面有人说股市中的数学model,他说只是相关就够用了,我多评价了两句,
说后面其实有理论支持,我的意思这个model有用,没有说这个model的什么
道德范围,然后你就说得我跟投机贩子似的,有人说话真让人不舒服。概率论最早出现
还根赌博相关呢?是不是做概率论的都是赌徒呢?
我发现您很会转移话题
我说的不是提高治愈的概率,治愈概率这是一个关于生命的,高1%乘上1M可能就是
一万人的生命。
但是我说的是model的正确率,model本身就是关于科学的。一个东西发生概
率50%,我吓懵就是成功50%的概率,你有个模型说我能60%概率预测这件事是
否发生,我会认为可能有些意义,但是不大。
【在 b****r 的大作中提到】
: 我的观点是研究怎么用model炒股就像研究怎么打麻将赢钱一样,对于社会来说是非常
: 消极的负面的一种行为,不创造财富,只转移和消耗财富
: 当然,如果你就是对打麻将有兴趣也能靠牌技高超从低手口袋里掏钱谋生甚至致富,我
: 也不会去攻击你,我自己不会去做这种事情而已
: 另外,生物甚至临床医学里提高百分之几的概率,有时候不光会被接受,甚至可以导致
: 一些人一夜暴富,更甚至可以造就一个新的行业。打个比方,近年兴起的个体化肿瘤用
: 药,其实也就是能在大规模统计学研究中稍微提高患者的生存率,还没有哪个药真能把
: 哪个恶性肿瘤从没治变有治
说后面其实有理论支持,我的意思这个model有用,没有说这个model的什么
道德范围,然后你就说得我跟投机贩子似的,有人说话真让人不舒服。概率论最早出现
还根赌博相关呢?是不是做概率论的都是赌徒呢?
我发现您很会转移话题
我说的不是提高治愈的概率,治愈概率这是一个关于生命的,高1%乘上1M可能就是
一万人的生命。
但是我说的是model的正确率,model本身就是关于科学的。一个东西发生概
率50%,我吓懵就是成功50%的概率,你有个模型说我能60%概率预测这件事是
否发生,我会认为可能有些意义,但是不大。
【在 b****r 的大作中提到】
: 我的观点是研究怎么用model炒股就像研究怎么打麻将赢钱一样,对于社会来说是非常
: 消极的负面的一种行为,不创造财富,只转移和消耗财富
: 当然,如果你就是对打麻将有兴趣也能靠牌技高超从低手口袋里掏钱谋生甚至致富,我
: 也不会去攻击你,我自己不会去做这种事情而已
: 另外,生物甚至临床医学里提高百分之几的概率,有时候不光会被接受,甚至可以导致
: 一些人一夜暴富,更甚至可以造就一个新的行业。打个比方,近年兴起的个体化肿瘤用
: 药,其实也就是能在大规模统计学研究中稍微提高患者的生存率,还没有哪个药真能把
: 哪个恶性肿瘤从没治变有治
t*a
132 楼
呵呵,真的吗?我怎么觉得历史总是惊人的相似呢。
From
over
millions
【在 b*******1 的大作中提到】
: You can not become an excellent bioinformatics scientist if you are still
: focusing on a paper published 10 years ago. Every 3-5 years, there is a
: revolution on the type of experiments and magnitude of data generated. From
: proteomics to transcriptome, RNA-Seq, exome, whole genome sequencing, to
: ENCODE, an excellent scientist always follow the data, and think a few
: years ahead of the crowd. Many of you think that NGS is a hot area. Last
: year, there is only tens of genome in my database; this year, there are over
: 10,000 genomes across tens of diseases; Next year, UK just announced a
: project to sequence 100,000 genome. In several years, we will have millions
: of genomes linked with electronic medical records. With such an amazing
From
over
millions
【在 b*******1 的大作中提到】
: You can not become an excellent bioinformatics scientist if you are still
: focusing on a paper published 10 years ago. Every 3-5 years, there is a
: revolution on the type of experiments and magnitude of data generated. From
: proteomics to transcriptome, RNA-Seq, exome, whole genome sequencing, to
: ENCODE, an excellent scientist always follow the data, and think a few
: years ahead of the crowd. Many of you think that NGS is a hot area. Last
: year, there is only tens of genome in my database; this year, there are over
: 10,000 genomes across tens of diseases; Next year, UK just announced a
: project to sequence 100,000 genome. In several years, we will have millions
: of genomes linked with electronic medical records. With such an amazing
y*j
133 楼
我们真正缺少的是什么的?
Data?
Algorithm?
Truly understanding data?
From
over
millions
【在 b*******1 的大作中提到】
: You can not become an excellent bioinformatics scientist if you are still
: focusing on a paper published 10 years ago. Every 3-5 years, there is a
: revolution on the type of experiments and magnitude of data generated. From
: proteomics to transcriptome, RNA-Seq, exome, whole genome sequencing, to
: ENCODE, an excellent scientist always follow the data, and think a few
: years ahead of the crowd. Many of you think that NGS is a hot area. Last
: year, there is only tens of genome in my database; this year, there are over
: 10,000 genomes across tens of diseases; Next year, UK just announced a
: project to sequence 100,000 genome. In several years, we will have millions
: of genomes linked with electronic medical records. With such an amazing
Data?
Algorithm?
Truly understanding data?
From
over
millions
【在 b*******1 的大作中提到】
: You can not become an excellent bioinformatics scientist if you are still
: focusing on a paper published 10 years ago. Every 3-5 years, there is a
: revolution on the type of experiments and magnitude of data generated. From
: proteomics to transcriptome, RNA-Seq, exome, whole genome sequencing, to
: ENCODE, an excellent scientist always follow the data, and think a few
: years ahead of the crowd. Many of you think that NGS is a hot area. Last
: year, there is only tens of genome in my database; this year, there are over
: 10,000 genomes across tens of diseases; Next year, UK just announced a
: project to sequence 100,000 genome. In several years, we will have millions
: of genomes linked with electronic medical records. With such an amazing
y*j
135 楼
还是可以的。例如
http://genomebiology.com/2011/12/10/R104
【在 t****a 的大作中提到】
: 就是啊,敲基因之类的事情是个找因果的办法,可惜一次只能敲一个啊。
: 啥时候能象咱们做计算模拟一样,搞个技术并行敲~,串行敲~,这因果的研究效率才
: 看到突破了。
http://genomebiology.com/2011/12/10/R104
【在 t****a 的大作中提到】
: 就是啊,敲基因之类的事情是个找因果的办法,可惜一次只能敲一个啊。
: 啥时候能象咱们做计算模拟一样,搞个技术并行敲~,串行敲~,这因果的研究效率才
: 看到突破了。
t*a
136 楼
Great! Thanks!
【在 y***j 的大作中提到】
: 还是可以的。例如
: http://genomebiology.com/2011/12/10/R104
【在 y***j 的大作中提到】
: 还是可以的。例如
: http://genomebiology.com/2011/12/10/R104
c*l
137 楼
从没治到有治的例子很多,imitinib治疗CML,retinoic acid 治疗 APL ,这样的例子
在不久的几年的到十几年里会层出不穷。
生物信息学目前或者说近几十到一百年内不会成为生物学研究的主流模式,主流仍然是
以假说为基础的的实验科学模式。这是由目前的生物学发展水平决定的。生物体太复杂
,在其主要蛋白质的功能和行为模式被发现完之前,不太可能可以用数学的方法对其建
模和准确的预测,只能作为生物学发现的重要辅助工具。
【在 b****r 的大作中提到】
: 我的观点是研究怎么用model炒股就像研究怎么打麻将赢钱一样,对于社会来说是非常
: 消极的负面的一种行为,不创造财富,只转移和消耗财富
: 当然,如果你就是对打麻将有兴趣也能靠牌技高超从低手口袋里掏钱谋生甚至致富,我
: 也不会去攻击你,我自己不会去做这种事情而已
: 另外,生物甚至临床医学里提高百分之几的概率,有时候不光会被接受,甚至可以导致
: 一些人一夜暴富,更甚至可以造就一个新的行业。打个比方,近年兴起的个体化肿瘤用
: 药,其实也就是能在大规模统计学研究中稍微提高患者的生存率,还没有哪个药真能把
: 哪个恶性肿瘤从没治变有治
在不久的几年的到十几年里会层出不穷。
生物信息学目前或者说近几十到一百年内不会成为生物学研究的主流模式,主流仍然是
以假说为基础的的实验科学模式。这是由目前的生物学发展水平决定的。生物体太复杂
,在其主要蛋白质的功能和行为模式被发现完之前,不太可能可以用数学的方法对其建
模和准确的预测,只能作为生物学发现的重要辅助工具。
【在 b****r 的大作中提到】
: 我的观点是研究怎么用model炒股就像研究怎么打麻将赢钱一样,对于社会来说是非常
: 消极的负面的一种行为,不创造财富,只转移和消耗财富
: 当然,如果你就是对打麻将有兴趣也能靠牌技高超从低手口袋里掏钱谋生甚至致富,我
: 也不会去攻击你,我自己不会去做这种事情而已
: 另外,生物甚至临床医学里提高百分之几的概率,有时候不光会被接受,甚至可以导致
: 一些人一夜暴富,更甚至可以造就一个新的行业。打个比方,近年兴起的个体化肿瘤用
: 药,其实也就是能在大规模统计学研究中稍微提高患者的生存率,还没有哪个药真能把
: 哪个恶性肿瘤从没治变有治
b*1
138 楼
我们真正缺少的是 a large number of scientists who understand what questions
to ask, know how to gather data, implement algorithms, identify findings,
and validate the findings. There are tons of people excel in each of these,
building thousands of tools for each step. However, we are still lacking a
large number of scientists who know all steps, and can push a question, a
drug, a target from the start to the end.
【在 y***j 的大作中提到】
: 我们真正缺少的是什么的?
: Data?
: Algorithm?
: Truly understanding data?
:
: From
: over
: millions
to ask, know how to gather data, implement algorithms, identify findings,
and validate the findings. There are tons of people excel in each of these,
building thousands of tools for each step. However, we are still lacking a
large number of scientists who know all steps, and can push a question, a
drug, a target from the start to the end.
【在 y***j 的大作中提到】
: 我们真正缺少的是什么的?
: Data?
: Algorithm?
: Truly understanding data?
:
: From
: over
: millions
t*a
140 楼
说的好,我们缺少architect level的scientist,真心希望经费落到这样的scientist
手上,说不定业余我也愿意参与他的项目帮他搞定计算方面的事情。
questions
,
【在 b*******1 的大作中提到】
: 我们真正缺少的是 a large number of scientists who understand what questions
: to ask, know how to gather data, implement algorithms, identify findings,
: and validate the findings. There are tons of people excel in each of these,
: building thousands of tools for each step. However, we are still lacking a
: large number of scientists who know all steps, and can push a question, a
: drug, a target from the start to the end.
手上,说不定业余我也愿意参与他的项目帮他搞定计算方面的事情。
questions
,
【在 b*******1 的大作中提到】
: 我们真正缺少的是 a large number of scientists who understand what questions
: to ask, know how to gather data, implement algorithms, identify findings,
: and validate the findings. There are tons of people excel in each of these,
: building thousands of tools for each step. However, we are still lacking a
: large number of scientists who know all steps, and can push a question, a
: drug, a target from the start to the end.
b*1
141 楼
Pushing a question from the start to the end is much easier than you thought
. I mentored some high school students before. From not knowing anything on
linux, they quickly learned how to analyze the impact of hundreds of
environmental factors on human genomes across worldwide maps in two months.
When I visited some big Pharma two years ago, everyone was worried about the
quality of data in public repositories, kept asking what is the best
protocol/tool to normalize data. This year, everyone is mining tons of data
to find new indications for their drugs.
Science, data, tool, method, protocol will never be perfect! If you hesitate
waiting for the perfect, you will never succeed. Get your hands dirty on
real problem, question, and data, you will gradually figure out the best
solutions. How many of you know the best strategy when you start playing a
game?
. I mentored some high school students before. From not knowing anything on
linux, they quickly learned how to analyze the impact of hundreds of
environmental factors on human genomes across worldwide maps in two months.
When I visited some big Pharma two years ago, everyone was worried about the
quality of data in public repositories, kept asking what is the best
protocol/tool to normalize data. This year, everyone is mining tons of data
to find new indications for their drugs.
Science, data, tool, method, protocol will never be perfect! If you hesitate
waiting for the perfect, you will never succeed. Get your hands dirty on
real problem, question, and data, you will gradually figure out the best
solutions. How many of you know the best strategy when you start playing a
game?
t*a
142 楼
谢谢
我想我的问题不是要get perfect。Without experiment,我认为pure bioinformatics
从根本上就无法回答因果之类的问题。
我并不是个初学者,文章也发了一些,只是希望能做到更好而已。
thought
on
.
the
data
hesitate
【在 b*******1 的大作中提到】
: Pushing a question from the start to the end is much easier than you thought
: . I mentored some high school students before. From not knowing anything on
: linux, they quickly learned how to analyze the impact of hundreds of
: environmental factors on human genomes across worldwide maps in two months.
: When I visited some big Pharma two years ago, everyone was worried about the
: quality of data in public repositories, kept asking what is the best
: protocol/tool to normalize data. This year, everyone is mining tons of data
: to find new indications for their drugs.
: Science, data, tool, method, protocol will never be perfect! If you hesitate
: waiting for the perfect, you will never succeed. Get your hands dirty on
我想我的问题不是要get perfect。Without experiment,我认为pure bioinformatics
从根本上就无法回答因果之类的问题。
我并不是个初学者,文章也发了一些,只是希望能做到更好而已。
thought
on
.
the
data
hesitate
【在 b*******1 的大作中提到】
: Pushing a question from the start to the end is much easier than you thought
: . I mentored some high school students before. From not knowing anything on
: linux, they quickly learned how to analyze the impact of hundreds of
: environmental factors on human genomes across worldwide maps in two months.
: When I visited some big Pharma two years ago, everyone was worried about the
: quality of data in public repositories, kept asking what is the best
: protocol/tool to normalize data. This year, everyone is mining tons of data
: to find new indications for their drugs.
: Science, data, tool, method, protocol will never be perfect! If you hesitate
: waiting for the perfect, you will never succeed. Get your hands dirty on
y*j
143 楼
解释数据总是很简单,但是正确的解释数据就不是这么容易了。
”This year, everyone is mining tons of data to find new indications for
their drugs.“
我感兴趣的是效果,也就是对制药帮助多大呢?
前年还是啥时候听过Merck一个哥们过来talk,他是做vaccine的,他背景是免疫,然后
他也是开始用了很多bioinformatics的预测,但是具体怎么做的的实在太久记不太清楚
了,但是最后结论就是没啥用。对结论记得清楚是因为当时还开玩笑那种嘲笑一个一起
听talk做生
物信息朋友。
thought
on
.
the
data
hesitate
【在 b*******1 的大作中提到】
: Pushing a question from the start to the end is much easier than you thought
: . I mentored some high school students before. From not knowing anything on
: linux, they quickly learned how to analyze the impact of hundreds of
: environmental factors on human genomes across worldwide maps in two months.
: When I visited some big Pharma two years ago, everyone was worried about the
: quality of data in public repositories, kept asking what is the best
: protocol/tool to normalize data. This year, everyone is mining tons of data
: to find new indications for their drugs.
: Science, data, tool, method, protocol will never be perfect! If you hesitate
: waiting for the perfect, you will never succeed. Get your hands dirty on
”This year, everyone is mining tons of data to find new indications for
their drugs.“
我感兴趣的是效果,也就是对制药帮助多大呢?
前年还是啥时候听过Merck一个哥们过来talk,他是做vaccine的,他背景是免疫,然后
他也是开始用了很多bioinformatics的预测,但是具体怎么做的的实在太久记不太清楚
了,但是最后结论就是没啥用。对结论记得清楚是因为当时还开玩笑那种嘲笑一个一起
听talk做生
物信息朋友。
thought
on
.
the
data
hesitate
【在 b*******1 的大作中提到】
: Pushing a question from the start to the end is much easier than you thought
: . I mentored some high school students before. From not knowing anything on
: linux, they quickly learned how to analyze the impact of hundreds of
: environmental factors on human genomes across worldwide maps in two months.
: When I visited some big Pharma two years ago, everyone was worried about the
: quality of data in public repositories, kept asking what is the best
: protocol/tool to normalize data. This year, everyone is mining tons of data
: to find new indications for their drugs.
: Science, data, tool, method, protocol will never be perfect! If you hesitate
: waiting for the perfect, you will never succeed. Get your hands dirty on
b*1
145 楼
In the ISMB this year, scientists from Merk organized a session to discuss
mining public data to reposition drugs.
【在 y***j 的大作中提到】
: 解释数据总是很简单,但是正确的解释数据就不是这么容易了。
: ”This year, everyone is mining tons of data to find new indications for
: their drugs.“
: 我感兴趣的是效果,也就是对制药帮助多大呢?
: 前年还是啥时候听过Merck一个哥们过来talk,他是做vaccine的,他背景是免疫,然后
: 他也是开始用了很多bioinformatics的预测,但是具体怎么做的的实在太久记不太清楚
: 了,但是最后结论就是没啥用。对结论记得清楚是因为当时还开玩笑那种嘲笑一个一起
: 听talk做生
: 物信息朋友。
:
mining public data to reposition drugs.
【在 y***j 的大作中提到】
: 解释数据总是很简单,但是正确的解释数据就不是这么容易了。
: ”This year, everyone is mining tons of data to find new indications for
: their drugs.“
: 我感兴趣的是效果,也就是对制药帮助多大呢?
: 前年还是啥时候听过Merck一个哥们过来talk,他是做vaccine的,他背景是免疫,然后
: 他也是开始用了很多bioinformatics的预测,但是具体怎么做的的实在太久记不太清楚
: 了,但是最后结论就是没啥用。对结论记得清楚是因为当时还开玩笑那种嘲笑一个一起
: 听talk做生
: 物信息朋友。
:
b*1
147 楼
When you have a good story, no one will reject to validate your hypothesis
for you. With new data, you can then go to an even bigger cow to validate
your new hypothesis. When you have a complete story, you know that your 因果
is correct. One analysis might not give you 因果, but you can hypothesize
因果, and then validate your hypothesis in new data.
It is always a circle. Data->findings->hypothesis->validation->new data->new
observation->theory.
bioinformatics
【在 t****a 的大作中提到】
: 谢谢
: 我想我的问题不是要get perfect。Without experiment,我认为pure bioinformatics
: 从根本上就无法回答因果之类的问题。
: 我并不是个初学者,文章也发了一些,只是希望能做到更好而已。
:
: thought
: on
: .
: the
: data
for you. With new data, you can then go to an even bigger cow to validate
your new hypothesis. When you have a complete story, you know that your 因果
is correct. One analysis might not give you 因果, but you can hypothesize
因果, and then validate your hypothesis in new data.
It is always a circle. Data->findings->hypothesis->validation->new data->new
observation->theory.
bioinformatics
【在 t****a 的大作中提到】
: 谢谢
: 我想我的问题不是要get perfect。Without experiment,我认为pure bioinformatics
: 从根本上就无法回答因果之类的问题。
: 我并不是个初学者,文章也发了一些,只是希望能做到更好而已。
:
: thought
: on
: .
: the
: data
n*4
148 楼
Bioinformatics scientists are the horses.
Traditional biologists are the driver.
Traditional biologists are the driver.
l*1
149 楼
不要只看到Bayesian+Markov Chain Monte Carlo (MCMC) 用于NGS sensitivity
analysis
新的非 Bayesian+MCMC的 Fisher Information Matrix (FIM) sensitivity
analysis 已有英国 帝国理工大的论文了吧 吧
Reference:
i,
Bioinformatics. (2012) 28:731-3.
web link:
HTTP://www.ncbi.nlm.nih.gov/pubmed/22378710
PDF file:
HTTP: //www.theosysbio.bio.ic.ac.uk/wp-content/uploads/2011/04/manual1.pdf
就是由减少Stochastic simulation process 中的参数 数量的 视点入手的
关联论文
ii,
J R Soc Interface. (2008) 5 Suppl 1:S59-69.
HTTP: //www.ncbi.nlm.nih.gov/pubmed/18482906
iii, Tumor Systrms pharmacological control 2009 paper,
HTTP: //www.rocq.inria.fr/bang/JC/JC4MMNP2009.pdf
附注:
生物统计学 PhD 毕业或 北清 数学 计算 工程学等 Master 的 高等数学 Matrix 训
练未经历wet-bio PD/PhD 可跳过 以上的文献 里的复杂的 偏微分/行列式 公式的推
导过程 无法看懂的...
,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
这个领域一定就很快发展,值得跳进去吗
非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
好的应用,不知道你读文章用心没
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
analysis
新的非 Bayesian+MCMC的 Fisher Information Matrix (FIM) sensitivity
analysis 已有英国 帝国理工大的论文了吧 吧
Reference:
i,
Bioinformatics. (2012) 28:731-3.
web link:
HTTP://www.ncbi.nlm.nih.gov/pubmed/22378710
PDF file:
HTTP: //www.theosysbio.bio.ic.ac.uk/wp-content/uploads/2011/04/manual1.pdf
就是由减少Stochastic simulation process 中的参数 数量的 视点入手的
关联论文
ii,
J R Soc Interface. (2008) 5 Suppl 1:S59-69.
HTTP: //www.ncbi.nlm.nih.gov/pubmed/18482906
iii, Tumor Systrms pharmacological control 2009 paper,
HTTP: //www.rocq.inria.fr/bang/JC/JC4MMNP2009.pdf
附注:
生物统计学 PhD 毕业或 北清 数学 计算 工程学等 Master 的 高等数学 Matrix 训
练未经历wet-bio PD/PhD 可跳过 以上的文献 里的复杂的 偏微分/行列式 公式的推
导过程 无法看懂的...
,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
这个领域一定就很快发展,值得跳进去吗
非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
好的应用,不知道你读文章用心没
【在 b****r 的大作中提到】
: 我读的这些生物信息相关的文章就是不分correlation vs causality,并不是我读得不
: 认真,我的合作的生物信息学者也没有提出能把这些方法用到我的几套data上
: Bayesian 那一套如果确实能解决大量实际生物问题,推动整个生物信息学发展当然好
: ,问题是贝叶斯这一套又不是新东西,大学里大家就多少有接触,predefined gene
: set听起来更加容易做到,实用的话,用我的common sense我不相信大家特别是生物信
: 息出身的人不愿广泛采用。当然我相信多少能起一点作用,就好象不分correlation vs
: causality的文章也有一些例子做出了不错的结果,但是你能据此说生物信息学目前在
: 这个领域一定就很快发展,值得跳进去吗
: 非我本专业我确实往往只能靠common sense和一点基础知识判断,不可能真正去钻研后
: 再来讨论。另外我可没有抱怨这个学科,我讲的很清楚,在我的领域生物信息学有非常
t*a
151 楼
能到达这样的高度真是令人敬仰!
new
【在 b*******1 的大作中提到】
: When you have a good story, no one will reject to validate your hypothesis
: for you. With new data, you can then go to an even bigger cow to validate
: your new hypothesis. When you have a complete story, you know that your 因果
: is correct. One analysis might not give you 因果, but you can hypothesize
: 因果, and then validate your hypothesis in new data.
: It is always a circle. Data->findings->hypothesis->validation->new data->new
: observation->theory.
:
: bioinformatics
new
【在 b*******1 的大作中提到】
: When you have a good story, no one will reject to validate your hypothesis
: for you. With new data, you can then go to an even bigger cow to validate
: your new hypothesis. When you have a complete story, you know that your 因果
: is correct. One analysis might not give you 因果, but you can hypothesize
: 因果, and then validate your hypothesis in new data.
: It is always a circle. Data->findings->hypothesis->validation->new data->new
: observation->theory.
:
: bioinformatics
l*1
152 楼
STEM killled 后 发首贴 报喜的 他/她的口中
http://www.mitbbs.com/article_t/Biology/31762137.html
你能指望突出象牙来嘛 ?
【在 t****a 的大作中提到】
: 如果生物学家们都像你这么想,而不是抱着平等合作的态度的话,那就请他们自己去学
: 数学计算机好了,我们最多周末帮忙干干。
: 我们在很多地方都是明星,犯不着过来吃力不讨好当horse。
http://www.mitbbs.com/article_t/Biology/31762137.html
你能指望突出象牙来嘛 ?
【在 t****a 的大作中提到】
: 如果生物学家们都像你这么想,而不是抱着平等合作的态度的话,那就请他们自己去学
: 数学计算机好了,我们最多周末帮忙干干。
: 我们在很多地方都是明星,犯不着过来吃力不讨好当horse。
t*a
153 楼
大牛,早就膜拜你的知识面了,你的中文是拿google translate翻译的吧
【在 l**********1 的大作中提到】
: STEM killled 后 发首贴 报喜的 他/她的口中
: http://www.mitbbs.com/article_t/Biology/31762137.html
: 你能指望突出象牙来嘛 ?
【在 l**********1 的大作中提到】
: STEM killled 后 发首贴 报喜的 他/她的口中
: http://www.mitbbs.com/article_t/Biology/31762137.html
: 你能指望突出象牙来嘛 ?
y*u
157 楼
v*g
158 楼
mark
b*n
160 楼
这个期刊比CNS的影响因子还高
对这个模型大家也就呵呵了
其实真正的G点是发文之后几个小时莫言就拿了诺贝尔奖,整个regression line就变了
。。
http://www.nejm.org/doi/full/10.1056/NEJMon1211064
【在 d********f 的大作中提到】
: 数学建模的核心在于模,不是数学,你看看biophysics发的那些cns,那模型都是小学
: 生水平
:
: 疗法
对这个模型大家也就呵呵了
其实真正的G点是发文之后几个小时莫言就拿了诺贝尔奖,整个regression line就变了
。。
http://www.nejm.org/doi/full/10.1056/NEJMon1211064
【在 d********f 的大作中提到】
: 数学建模的核心在于模,不是数学,你看看biophysics发的那些cns,那模型都是小学
: 生水平
:
: 疗法
n*4
164 楼
恰恰相反,现在数据多得分析不过来。分析严重滞后。问问每个bioinformatian有多大
压力就知道了。当然,可靠的实验数据也很关键,必竟是bioinformatics的基础和
reference. 这二者互相影响。
数据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这
个好走多了。
【在 y**u 的大作中提到】
: 显然谁都不想,但是总得有人做。大家都想着用,用不了多久的。
: BTW, 生产数据不同于生产原油。实验材料制造才是。bioinfo是辅助性的,另外和数
: 据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这个
: 好走多了。
压力就知道了。当然,可靠的实验数据也很关键,必竟是bioinformatics的基础和
reference. 这二者互相影响。
数据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这
个好走多了。
【在 y**u 的大作中提到】
: 显然谁都不想,但是总得有人做。大家都想着用,用不了多久的。
: BTW, 生产数据不同于生产原油。实验材料制造才是。bioinfo是辅助性的,另外和数
: 据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这个
: 好走多了。
y*u
165 楼
我不太了解。但是数据是很多年的积累,而且二者的加速度差远了。我们系里有专门的
做分析的,很多结果只能给我们一个方向,之后很多verify不了,或发现方向错误/不
work。从制药的角度,很多东西最后还是归结到bench了。
我现在的感觉是最好能够让好的wet lab scientist接受bioinfo training,可以自己
做一点,也更好交流。现在,无论wet bench还是bioinfo, 我觉得都很多无用功。另外
我依然相信以前一个大牛老头讲的,科学是有品味的,只有深刻了解sicence, 才能更
好的选择方向,更敏感。不过想想而已,我自己不打算做research了。
【在 n*********4 的大作中提到】
: 恰恰相反,现在数据多得分析不过来。分析严重滞后。问问每个bioinformatian有多大
: 压力就知道了。当然,可靠的实验数据也很关键,必竟是bioinformatics的基础和
: reference. 这二者互相影响。
:
: 数据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这
: 个好走多了。
做分析的,很多结果只能给我们一个方向,之后很多verify不了,或发现方向错误/不
work。从制药的角度,很多东西最后还是归结到bench了。
我现在的感觉是最好能够让好的wet lab scientist接受bioinfo training,可以自己
做一点,也更好交流。现在,无论wet bench还是bioinfo, 我觉得都很多无用功。另外
我依然相信以前一个大牛老头讲的,科学是有品味的,只有深刻了解sicence, 才能更
好的选择方向,更敏感。不过想想而已,我自己不打算做research了。
【在 n*********4 的大作中提到】
: 恰恰相反,现在数据多得分析不过来。分析严重滞后。问问每个bioinformatian有多大
: 压力就知道了。当然,可靠的实验数据也很关键,必竟是bioinformatics的基础和
: reference. 这二者互相影响。
:
: 数据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这
: 个好走多了。
t*a
166 楼
呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
—当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
的scientist。由他们来设计整个项目的框架。
architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
【在 n*********4 的大作中提到】
: 恰恰相反,现在数据多得分析不过来。分析严重滞后。问问每个bioinformatian有多大
: 压力就知道了。当然,可靠的实验数据也很关键,必竟是bioinformatics的基础和
: reference. 这二者互相影响。
:
: 数据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这
: 个好走多了。
数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
—当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
的scientist。由他们来设计整个项目的框架。
architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
【在 n*********4 的大作中提到】
: 恰恰相反,现在数据多得分析不过来。分析严重滞后。问问每个bioinformatian有多大
: 压力就知道了。当然,可靠的实验数据也很关键,必竟是bioinformatics的基础和
: reference. 这二者互相影响。
:
: 数据产生/verify的进度不匹配,大量投入还是很有风险的。但就个人career而言,这
: 个好走多了。
n*4
167 楼
bioinfo基本上是给方向和缩小研究对象的范围。也有不少为发文章而作。离实用还有
不少距离。无用功是科学研究的特点,科学不同于工程,不能设计。一但有发现,就是
了不体的成就。只不过苦了做无用功的人。一将明成万骨枯。
【在 y**u 的大作中提到】
: 我不太了解。但是数据是很多年的积累,而且二者的加速度差远了。我们系里有专门的
: 做分析的,很多结果只能给我们一个方向,之后很多verify不了,或发现方向错误/不
: work。从制药的角度,很多东西最后还是归结到bench了。
: 我现在的感觉是最好能够让好的wet lab scientist接受bioinfo training,可以自己
: 做一点,也更好交流。现在,无论wet bench还是bioinfo, 我觉得都很多无用功。另外
: 我依然相信以前一个大牛老头讲的,科学是有品味的,只有深刻了解sicence, 才能更
: 好的选择方向,更敏感。不过想想而已,我自己不打算做research了。
不少距离。无用功是科学研究的特点,科学不同于工程,不能设计。一但有发现,就是
了不体的成就。只不过苦了做无用功的人。一将明成万骨枯。
【在 y**u 的大作中提到】
: 我不太了解。但是数据是很多年的积累,而且二者的加速度差远了。我们系里有专门的
: 做分析的,很多结果只能给我们一个方向,之后很多verify不了,或发现方向错误/不
: work。从制药的角度,很多东西最后还是归结到bench了。
: 我现在的感觉是最好能够让好的wet lab scientist接受bioinfo training,可以自己
: 做一点,也更好交流。现在,无论wet bench还是bioinfo, 我觉得都很多无用功。另外
: 我依然相信以前一个大牛老头讲的,科学是有品味的,只有深刻了解sicence, 才能更
: 好的选择方向,更敏感。不过想想而已,我自己不打算做research了。
M*P
168 楼
Real world is not like the matrix. There is no architect for such a huge
industry of biomedical research. If you really want an architect, whoever in
charge of money distribution is the architect. Here is what the "architect
" say about bioinformatics:
"We are living in an awkward interval where our ability to capture the
information often exceeds our ability to know what to do with it."
--Francis Collins.
level
【在 t****a 的大作中提到】
: 呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
: 数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
: 所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
: —当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
: 的scientist。由他们来设计整个项目的框架。
: architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
industry of biomedical research. If you really want an architect, whoever in
charge of money distribution is the architect. Here is what the "architect
" say about bioinformatics:
"We are living in an awkward interval where our ability to capture the
information often exceeds our ability to know what to do with it."
--Francis Collins.
level
【在 t****a 的大作中提到】
: 呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
: 数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
: 所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
: —当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
: 的scientist。由他们来设计整个项目的框架。
: architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
t*a
169 楼
呵呵,我还是不相信牛文是走一步看一步撞出来的。多少应该有个大体的项目设计吧。
in
architect
【在 M*P 的大作中提到】
: Real world is not like the matrix. There is no architect for such a huge
: industry of biomedical research. If you really want an architect, whoever in
: charge of money distribution is the architect. Here is what the "architect
: " say about bioinformatics:
: "We are living in an awkward interval where our ability to capture the
: information often exceeds our ability to know what to do with it."
: --Francis Collins.
:
: level
in
architect
【在 M*P 的大作中提到】
: Real world is not like the matrix. There is no architect for such a huge
: industry of biomedical research. If you really want an architect, whoever in
: charge of money distribution is the architect. Here is what the "architect
: " say about bioinformatics:
: "We are living in an awkward interval where our ability to capture the
: information often exceeds our ability to know what to do with it."
: --Francis Collins.
:
: level
l*1
170 楼
名校 新人PhD 的 有关 关键词的 博士论文 最近三年到五年的 至少100篇
其全部PDF 文档或hard paper 都参考一下的话 可以看出点 如何建筑这幢楼的 端倪了
吧 (possible)
比如
citation from UBC 2009 PhD dissertation: "Particle Markov Chain Monte Carlo"
by
Roman Holenstein
full text pdf link:
HTTP: //www.cs.ubc.ca/grads/resources/thesis/May09/Holenstein_Roman.pdf
Monte Carlo methods have become the standard tool to solve many problems in
statistics and scientific computing. Examples are abound, and include
instances in
Bayesian statistics (posterior estimation), statistical physics (Ising model
), particle
physics (simulation of high energy particles interacting with a detector),
biology
(protein folding, Lotka-Volterra model), chemistry (chemical reaction
networks),
and finance (option valuation), to name a few.
当然 和作者本人 如有机会 有关学术会议 coffee break 直接聊的话
可能更有启发
HTTP: //www.cs.ubc.ca/~romanh/resume/Roman_Holenstein_resume.html
要是没时间的 可以找关联Google 博客 直接上那里 开贴 求解 如何?
HTTPS : //groups.google.com/forum/?fromgroups#!forum/beast-users
Beast (1.6.1) with Beagle-lib
BEAST is a cross-platform program for Bayesian MCMC analysis of molecular
sequences. It is entirely orientated towards rooted, time-measured
phylogenies inferred using strict or relaxed molecular clock models. It can
be used as a method of reconstructing phylogenies but is also a framework
for testing evolutionary hypotheses without conditioning on a single tree
topology. BEAST uses MCMC to average over tree space, so that each tree is
weighted proportional to its posterior probability.
HTTP: //beast.bio.ed.ac.uk/Main_Page
HTTP: //code.google.com/p/beagle-lib/wiki/LinuxInstallInstructions
HTTP : //gyra.ualg.pt/
level
【在 t****a 的大作中提到】
: 呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
: 数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
: 所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
: —当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
: 的scientist。由他们来设计整个项目的框架。
: architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
其全部PDF 文档或hard paper 都参考一下的话 可以看出点 如何建筑这幢楼的 端倪了
吧 (possible)
比如
citation from UBC 2009 PhD dissertation: "Particle Markov Chain Monte Carlo"
by
Roman Holenstein
full text pdf link:
HTTP: //www.cs.ubc.ca/grads/resources/thesis/May09/Holenstein_Roman.pdf
Monte Carlo methods have become the standard tool to solve many problems in
statistics and scientific computing. Examples are abound, and include
instances in
Bayesian statistics (posterior estimation), statistical physics (Ising model
), particle
physics (simulation of high energy particles interacting with a detector),
biology
(protein folding, Lotka-Volterra model), chemistry (chemical reaction
networks),
and finance (option valuation), to name a few.
当然 和作者本人 如有机会 有关学术会议 coffee break 直接聊的话
可能更有启发
HTTP: //www.cs.ubc.ca/~romanh/resume/Roman_Holenstein_resume.html
要是没时间的 可以找关联Google 博客 直接上那里 开贴 求解 如何?
HTTPS : //groups.google.com/forum/?fromgroups#!forum/beast-users
Beast (1.6.1) with Beagle-lib
BEAST is a cross-platform program for Bayesian MCMC analysis of molecular
sequences. It is entirely orientated towards rooted, time-measured
phylogenies inferred using strict or relaxed molecular clock models. It can
be used as a method of reconstructing phylogenies but is also a framework
for testing evolutionary hypotheses without conditioning on a single tree
topology. BEAST uses MCMC to average over tree space, so that each tree is
weighted proportional to its posterior probability.
HTTP: //beast.bio.ed.ac.uk/Main_Page
HTTP: //code.google.com/p/beagle-lib/wiki/LinuxInstallInstructions
HTTP : //gyra.ualg.pt/
level
【在 t****a 的大作中提到】
: 呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
: 数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
: 所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
: —当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
: 的scientist。由他们来设计整个项目的框架。
: architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
t*a
171 楼
非常感谢。待会下班看看。
Carlo"
【在 l**********1 的大作中提到】
: 名校 新人PhD 的 有关 关键词的 博士论文 最近三年到五年的 至少100篇
: 其全部PDF 文档或hard paper 都参考一下的话 可以看出点 如何建筑这幢楼的 端倪了
: 吧 (possible)
: 比如
: citation from UBC 2009 PhD dissertation: "Particle Markov Chain Monte Carlo"
:
: by
: Roman Holenstein
: full text pdf link:
: HTTP: //www.cs.ubc.ca/grads/resources/thesis/May09/Holenstein_Roman.pdf
Carlo"
【在 l**********1 的大作中提到】
: 名校 新人PhD 的 有关 关键词的 博士论文 最近三年到五年的 至少100篇
: 其全部PDF 文档或hard paper 都参考一下的话 可以看出点 如何建筑这幢楼的 端倪了
: 吧 (possible)
: 比如
: citation from UBC 2009 PhD dissertation: "Particle Markov Chain Monte Carlo"
:
: by
: Roman Holenstein
: full text pdf link:
: HTTP: //www.cs.ubc.ca/grads/resources/thesis/May09/Holenstein_Roman.pdf
l*1
172 楼
不客气
plus
Medical diagnostics
Dynamical diseases
Heart rate variability
Cardio-vascular model
at
NONLINEAR DYNAMICS AND CHAOS (2007)
by Patrick E McSharry
University of Oxford
web link:
HTTP : //people.maths.ox.ac.uk/mcsharry/lectures/ndc/lecture11notes.pdf
4. Fractals and Attractors
5. Bifurcations
6. Quantifying Chaos
7. Nonlinear Time Series Analysis
8. Nonlinear Modelling and Forecasting
HTTP : //people.maths.ox.ac.uk/mcsharry/lectures/ndc/lecture1notes.pdf
and one bible book:
Nonlinear Dynamics and Chaos with Applications to Physics, Biology,
Chemistry, and Engineering. (2001)
by S. H. Strogatz
Westview, Boulder, CO, US
E-book PDF free download link:
HTTP: //users.uoa.gr/~pjioannou/nonlin/Strogatz,%20S.%20H.%20-%20Nonlinear%
20Dynamics%20And%20Chaos.pdf
【在 t****a 的大作中提到】
: 非常感谢。待会下班看看。
:
: Carlo"
plus
Medical diagnostics
Dynamical diseases
Heart rate variability
Cardio-vascular model
at
NONLINEAR DYNAMICS AND CHAOS (2007)
by Patrick E McSharry
University of Oxford
web link:
HTTP : //people.maths.ox.ac.uk/mcsharry/lectures/ndc/lecture11notes.pdf
4. Fractals and Attractors
5. Bifurcations
6. Quantifying Chaos
7. Nonlinear Time Series Analysis
8. Nonlinear Modelling and Forecasting
HTTP : //people.maths.ox.ac.uk/mcsharry/lectures/ndc/lecture1notes.pdf
and one bible book:
Nonlinear Dynamics and Chaos with Applications to Physics, Biology,
Chemistry, and Engineering. (2001)
by S. H. Strogatz
Westview, Boulder, CO, US
E-book PDF free download link:
HTTP: //users.uoa.gr/~pjioannou/nonlin/Strogatz,%20S.%20H.%20-%20Nonlinear%
20Dynamics%20And%20Chaos.pdf
【在 t****a 的大作中提到】
: 非常感谢。待会下班看看。
:
: Carlo"
l*1
173 楼
以下的表格里的公式 楼主可以 选三个 写三个 用 Matlab 的 source code
看看用于解惑啥生物演化或社会经济变化的问题或现象 如何?
当然周末有空闲的话...
cited from
Dynamics, evolution and information in nonlinear dynamical systems of
replicators.
by Josep Sardanyés i Cayuela.
Universitat Pompeu Fabra (UPF), Barcelona PhD thesis (2009)
web link:
HTTP: //complex.upf.es/~josep/thesisJosepSardanyes.pdf
【在 t****a 的大作中提到】
: 非常感谢。待会下班看看。
:
: Carlo"
看看用于解惑啥生物演化或社会经济变化的问题或现象 如何?
当然周末有空闲的话...
cited from
Dynamics, evolution and information in nonlinear dynamical systems of
replicators.
by Josep Sardanyés i Cayuela.
Universitat Pompeu Fabra (UPF), Barcelona PhD thesis (2009)
web link:
HTTP: //complex.upf.es/~josep/thesisJosepSardanyes.pdf
【在 t****a 的大作中提到】
: 非常感谢。待会下班看看。
:
: Carlo"
t*a
175 楼
谢谢这些信息,感觉很像“复杂科学”讨论的问题,先记下,有空要去看一看,
【在 l**********1 的大作中提到】
: 以下的表格里的公式 楼主可以 选三个 写三个 用 Matlab 的 source code
: 看看用于解惑啥生物演化或社会经济变化的问题或现象 如何?
: 当然周末有空闲的话...
: cited from
: Dynamics, evolution and information in nonlinear dynamical systems of
: replicators.
: by Josep Sardanyés i Cayuela.
: Universitat Pompeu Fabra (UPF), Barcelona PhD thesis (2009)
: web link:
: HTTP: //complex.upf.es/~josep/thesisJosepSardanyes.pdf
【在 l**********1 的大作中提到】
: 以下的表格里的公式 楼主可以 选三个 写三个 用 Matlab 的 source code
: 看看用于解惑啥生物演化或社会经济变化的问题或现象 如何?
: 当然周末有空闲的话...
: cited from
: Dynamics, evolution and information in nonlinear dynamical systems of
: replicators.
: by Josep Sardanyés i Cayuela.
: Universitat Pompeu Fabra (UPF), Barcelona PhD thesis (2009)
: web link:
: HTTP: //complex.upf.es/~josep/thesisJosepSardanyes.pdf
l*1
176 楼
RNA world 不考虑DNA 的话 就必须用上 混沌科学的模型哦
pls refer
以上09博论的作者的后续 one paper:
Sardanyés J et al. (2012)
Dynamics of alternative modes of RNA replication for positive-sense RNA
viruses.
J R Soc Interface. 9: 768-76.
web link:
HTTP: //www.ncbi.nlm.nih.gov/pubmed/21900320
full text PDF link:
HTTP : //digital.csic.es/bitstream/10261/48825/1/JRSocInterface_9_768_2012.
pdf
from
HTTP: //complex.upf.es/~josep/
【在 t****a 的大作中提到】
: 谢谢这些信息,感觉很像“复杂科学”讨论的问题,先记下,有空要去看一看,
pls refer
以上09博论的作者的后续 one paper:
Sardanyés J et al. (2012)
Dynamics of alternative modes of RNA replication for positive-sense RNA
viruses.
J R Soc Interface. 9: 768-76.
web link:
HTTP: //www.ncbi.nlm.nih.gov/pubmed/21900320
full text PDF link:
HTTP : //digital.csic.es/bitstream/10261/48825/1/JRSocInterface_9_768_2012.
from
HTTP: //complex.upf.es/~josep/
【在 t****a 的大作中提到】
: 谢谢这些信息,感觉很像“复杂科学”讨论的问题,先记下,有空要去看一看,
y*t
177 楼
要是这样的模型拿到期货市场上,一次波动就破产了。 拜托,生物模型错了,不会怎
样。 股票期货模型错了,可能一笔就亏爆了。 生物模型,不用自己赔钱的,当然尽可
以归纳总结因果关系。 只是问题在于生物那一点的数据跟股市比起来是九牛一毛,却
要求得到正确的机理,能有好模型吗? 能证实存在某种联系就不错了,至于causal
relationship,我真不敢写进paper里, 怕被reviewer骂死。
【在 y***j 的大作中提到】
: 这个不太一样吧。股票那个是应用性的,不需要后面的机理也就是说数字上的
: correlation就够了,不需要causal relationship,科学的最终目的还是要发现背后机
: 理的。
: 股票期货我的理解是在一个平稳没有增长没有降低的市场上如果做一个交易假定随机交
: 易赔钱概率50%赚钱概率50%,做1000次交易,你最后的结果是不赚不陪,你做出一个比
: 较烂的model稍微改善一下,能达到40%赔钱60%赚钱,做1000次交易你就有200次交易是
: 赚钱的,可以说是一个够用的好模型了。而且股票期货交易的模型我理解也是减少投资
: 者因
: 为贪婪造成该涨的时候改卖没卖,跌的时候该割肉时候舍不得割吧。
: 如果生物学科你觉得一个错误率40%的模型是好模型么?
样。 股票期货模型错了,可能一笔就亏爆了。 生物模型,不用自己赔钱的,当然尽可
以归纳总结因果关系。 只是问题在于生物那一点的数据跟股市比起来是九牛一毛,却
要求得到正确的机理,能有好模型吗? 能证实存在某种联系就不错了,至于causal
relationship,我真不敢写进paper里, 怕被reviewer骂死。
【在 y***j 的大作中提到】
: 这个不太一样吧。股票那个是应用性的,不需要后面的机理也就是说数字上的
: correlation就够了,不需要causal relationship,科学的最终目的还是要发现背后机
: 理的。
: 股票期货我的理解是在一个平稳没有增长没有降低的市场上如果做一个交易假定随机交
: 易赔钱概率50%赚钱概率50%,做1000次交易,你最后的结果是不赚不陪,你做出一个比
: 较烂的model稍微改善一下,能达到40%赔钱60%赚钱,做1000次交易你就有200次交易是
: 赚钱的,可以说是一个够用的好模型了。而且股票期货交易的模型我理解也是减少投资
: 者因
: 为贪婪造成该涨的时候改卖没卖,跌的时候该割肉时候舍不得割吧。
: 如果生物学科你觉得一个错误率40%的模型是好模型么?
d*r
178 楼
correct.
that's why academia and wall street are suitable for totally diff kind of
personality.
【在 y****t 的大作中提到】
: 要是这样的模型拿到期货市场上,一次波动就破产了。 拜托,生物模型错了,不会怎
: 样。 股票期货模型错了,可能一笔就亏爆了。 生物模型,不用自己赔钱的,当然尽可
: 以归纳总结因果关系。 只是问题在于生物那一点的数据跟股市比起来是九牛一毛,却
: 要求得到正确的机理,能有好模型吗? 能证实存在某种联系就不错了,至于causal
: relationship,我真不敢写进paper里, 怕被reviewer骂死。
that's why academia and wall street are suitable for totally diff kind of
personality.
【在 y****t 的大作中提到】
: 要是这样的模型拿到期货市场上,一次波动就破产了。 拜托,生物模型错了,不会怎
: 样。 股票期货模型错了,可能一笔就亏爆了。 生物模型,不用自己赔钱的,当然尽可
: 以归纳总结因果关系。 只是问题在于生物那一点的数据跟股市比起来是九牛一毛,却
: 要求得到正确的机理,能有好模型吗? 能证实存在某种联系就不错了,至于causal
: relationship,我真不敢写进paper里, 怕被reviewer骂死。
y*t
179 楼
现在的数据其实不多,要嘛单一类型的数据,要嘛就是把不同实验室不同条件的数据堆
在一块。 号称几千个samples常常就是上网收集来的。 真正仔细对一种疾病,由一个
项目组产生各种类型高通量数据,也没有多少。 确实PI一定要牛,数据质量严格把关
,不然最后成了一堆烂摊子,丢给我们这些bioinformatician。
level
【在 t****a 的大作中提到】
: 呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
: 数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
: 所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
: —当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
: 的scientist。由他们来设计整个项目的框架。
: architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
在一块。 号称几千个samples常常就是上网收集来的。 真正仔细对一种疾病,由一个
项目组产生各种类型高通量数据,也没有多少。 确实PI一定要牛,数据质量严格把关
,不然最后成了一堆烂摊子,丢给我们这些bioinformatician。
level
【在 t****a 的大作中提到】
: 呵呵,现在数据是很多。作为一个bioinformatician,我的疑问是我们真的需要那么多
: 数据么——很多项目整个设计的一团糟,我不去分析也看得到下场。
: 所以啊,这个学科需要的不是实验员和大数据,不是更多的电脑和bioinformatition—
: —当然他们是必须的。真正缺少的是前面一位朋友所说的,我认为的architect level
: 的scientist。由他们来设计整个项目的框架。
: architect是建筑大师的意思。在IT业内设计整个系统的人被称为architect。
相关阅读
一个医学统计问题 (转载)看着俩kit, nucleospin extract 2 and QiaEX2,哪个好? PCR产物韩春雨的阿狗, 决不是什么小事发了的文章,用错图片了,真的可以改吗?回国再出国容易么?仇子龙的声明看了仇的声明arraystar Human LncRNA Expression MicroarrayClinical SAS training will start soon!一个搞物理的悄悄地评论一下大家对韩春雨老师论文的争论方舟子的评论会不会造成韩春雨心态不稳而无法重复诺奖级成果?不赞成现在把关于韩春雨NgAgo的讨论翻译成英文给洋鬼子以后发文章要附带录像了。尼玛!现在生物版的几个上窜下跳的是经过科学训练的吗?!有偿求血浆DNA提取生物之所以不灭亡,是出于对癌症的攻克与长寿的追求韩春雨的电话录音问一个投稿问题版上全在讨论韩春雨,换个问题问问,毕业去向问题paper help!