Redian新闻
>
统计学在系统生物学的作用
avatar
统计学在系统生物学的作用# Biology - 生物学
k*n
1
还以为是新来的本科intern,
结果给我发email的Title吓我一跳。
Software Engineering Team Leader
Agile Competence Center Ambassador, Scrum Master
avatar
w*o
2
歌词:
My Eye, The apple of my eye, Rest your eyes and sleep
Oh Flower Are you a Peacock?
Peacock with beautiful feathers?
Are you a Nightingale
Nightingale that sings beautifully
Are you the Moon?
Are you the light of the Moon?
Are you the eyelid?
Are you the dream inside those eyelids?
Ra ra ro (repeat)
Are you a Flower? Are the nectar of the Flower?
Are you a fruit?
Are you the delicious taste of a ripe fruit?
Ra ra ro (repeat)
片头听说一部分是在台北动物园拍的?
唱这曲的歌手在印度挺nb的∶
http://en.wikipedia.org/wiki/Bombay_Jayashri
avatar
q*2
3
【 以下文字转载自 SciFiction 讨论区 】
发信人: qiao2 (二寸灰), 信区: SciFiction
标 题: 拔魔 第一百五十三章 又见黑狼
发信站: BBS 未名空间站 (Mon Aug 18 21:19:24 2014, 美东)
第一百五十三章 又见黑狼
慕行秋还记得自己第一次学会五行之金法术,将一股虚无法力变成真实利刃时的震撼感
觉。
那种感觉与念诵咒语时的麻酥截然不同:下丹田处的内丹本来就一刻不停地旋转,
这时转得更快,带动整个人产生一种足不沾地飞升感,充沛的法力如同水银一般瞬间传
到中丹田绛宫,在这里依照泥丸宫的存想而变幻形态,但这时它还是虚无的,得经过一
到若干次法诀指引,才会在施法者体外的某一处地方凝聚成形。
这有点像是幼魔由烟雾转变成实体的过程,只是更快更决绝,一丁点的拖泥带水也
会令法术失败或失控,越高级的法术其存想过程和法诀越复杂,但不管怎样都得在瞬间
完成。
如果有主法器,中间还会多一道程序,绛宫的法力在法器内部引起反应,经此之后
成形的法术会得到一定程度的强化,比如紫纹剑就能增强二三成的力量。
慕行秋喜欢这种感觉。
三道百步刃准确中妖魔,在他身上留下三条清晰的伤口,鲜血染红了浓厚的毛发,
钢刃消失了。
妖魔却没有倒下,他们在抵抗法术和忍受伤痛方面比人类坚韧得多,发出一声更高
亢的怒吼,将一只手中的巨大石块扔过来。
慕行秋在空中轻巧地躲过,离敌人更近,只有四五十步,连续两次施法,六道钢刃
分批射出去,全都击中同一个地方。
他一点也不慌张,这是他第一次纯以法术迎战妖魔,却像经验丰富的老手一样镇定
自若,根本没去想养神峰都教是怎么传授的,一切水到渠成,跟一场普通的打架没有两
样。
长毛怪的另一条胳膊被斩断了,鲜血喷涌,仿佛又长出了一条红色的臂膀。尚且生
存的黑狼掉在岩石上,四肢乱蹬,一时间却挣脱不掉那条毛茸茸的胳膊。
长毛怪的吼叫声震得地面都在发抖,他个头虽大。实力却不强,看样子只是妖身一
丈左右的小妖。
慕行秋绕着长毛怪飞行一圈,不停地以百步刃发起进攻,手段虽然单一,却很见效
,高大妖魔浑身鲜血淋漓,单手扔出几块石头之后,吼叫声骤停,重重地倒在乱石中间。
慕行秋降落在数十步之外一块高耸的岩石顶上,观察死去的长毛怪。
可是更能引起他注意的却是尸体旁边的黑狼。
黑狼终于挣脱了断臂的掌握。缩头夹尾地想要逃跑,猛然间从附近一处隐蔽的石缝
里蹿出另一只黑狼,一口咬住第一匹黑狼的咽喉,头部猛甩,很快就将猎物咬断了气。
第二匹黑狼抬起头。看着数十步之外的青年道士,空洞的左眼了无生气,右眼里却
充满了杀机,利齿微露,发出威胁的低吼。
后面的三名道士赶到,停在空中,没有检查尸体。而是一块看着主攻者。
慕行秋明白他们的意思,除妖过程还没有完成,可他既无明镜,也无铜铃,难以检
测妖尸和黑狼是否暗藏玄机,他拒绝向三人求助。重新御剑飞起,绕着尸体飞了两圈,
黑狼的独眼一直盯着他。
慕行秋突然降落,加速向妖尸飞去,同时施法射出百步刃。目标却是那头警惕的黑
狼。
三名道士互相看了一眼,全都露出鄙视的微笑,可接下来的场景就让他们对这名念
心科弟子刮目相看了。
妖尸里果然有异,就在慕行秋逼近一丈有余的那一刻,妖魔水桶般的肚子猛然爆裂
,喷出大量鲜血,直奔大意的敌人和射向黑狼的三道利刃。
不洁之血会对道士的法术产生种种不利影响,利刃经过血幕之后速度大幅降低,黑
狼得以撒腿逃跑,避开致命一击。
可慕行秋并未大意,早有准备,在空中一个急转弯,绕过喷涌而出的鲜血,接连不
断地向妖尸腹部发射利刃。
躲藏的第二只妖魔跳出来了,身高不过两尺,赤身无衣,背后却生有一对薄如蝉翼
、形状也有点像是蝉翼的翅膀,小手握着一根骨头似的棍棒,挡开利刃,展翅向北方飞
逃。
牙山道士申忌夷带着田阡陌飞来了,另外三人不能再作壁上观,纷纷施法,或摇动
铜铃,或发招拦截,年纪最大的次攻道士甚至伸出手,隔空取物,将黑狼的一条后腿抓
在手里。
会飞的小妖听到铃声,立刻放慢速度,抱头摇晃,嘴里发出尖厉的叫声,像是某种
语言,慕行秋一句也听不懂,只猜测那是诅咒。
四十岁道士在黑狼身上打量几眼,随手就要将它扔出。
慕行秋急忙开口阻止,“等等,那只狼……”
“很普通。”四十岁道士冷淡地说,轻轻一抛,黑狼飞出一里多,落在乱石堆中再
没有出现,“你还有一只妖没杀。”
慕行秋转身追上蝉翼妖。
除了那对翅膀,小妖完全是几岁儿童的相貌,胖乎乎的四肢和肥嘟嘟脸颊分外惹人
喜爱,捂着双耳拒听铃声,更像是闹脾气的小孩子。
大多数人都不会对这样的小东西下杀手,道士们却经过教育,知道这是有名的内噬
妖,专门藏在体格壮大的妖魔体内,逼迫宿主杀戮其他妖魔和人类,吞吃猎物的脑浆。
慕行秋看过内噬妖的图像和介绍,因此只是稍作犹豫,立刻发出多道法术,将其斩
杀。蝉翼妖被铃声震得神智半失,根本没有能力阻挡进攻。
田阡陌落地,以明镜照射一圈,收起法器宣布除妖结束。一名道士割取妖丹,随后
五人在妖尸附近找一块干净些的地方聚合,总结并检讨刚刚结束的行动,申忌夷站在边
上,仍然不怎么说话。
四十岁道士虽然只是次攻,但是经验丰富,所以不客气地第一个发言:“慕行秋道
友第一次参加演练,表现不错,不过有几次重大失误,第一,向妖尸俯冲过于冒险。不
是咱们庞山道统除妖的风格,第二,判断发生失误,对一匹普通的狼给予过多关注。差
点放过真正的妖魔。那只蝉翼妖看上去很小,妖身可能有两丈。”
几人轮流发言,都在指责新人的失误。慕行秋安静地听着,轮到他发言时也不想客
气了,“我觉得古云极道友犯了一个错误。”
古云极就是那名四十岁的道士,在小队中年纪最大、修行最高、经验最丰富,虽然
称不上天才,但是在五行科还是颇受尊重的,听到这话脸色微沉,“哦。没想到慕行秋
道友眼光如此毒辣,说说吧,我犯了什么错误?”
“那匹黑狼并不普通,它是妖王漆无上退化而成。”虽然两匹黑狼长得几乎一样,
慕行秋还是认出了细微差别。尤其是漆无上的个头更小一些。
“当年我参与过围捕妖王。”古云极冷冷地说,“亲眼看着它被老祖峰夺走妖丹。
你想说什么?妖王还残存着几分妖力不成?”
五行科道士们齐声冷笑,慕行秋却坚持自己的看法,“漆无上咬死了自己的孪生弟
弟漆无暇,还跟两只妖魔混在一起,我觉得……我觉得……”
“你觉得什么?”
“我觉得漆无上在控制这两只妖魔,咱们应该把它找回来。它跑不远。”
道士们不只是冷笑,而是大笑了,田阡陌说:“慕行秋道友,你想得太多了,东北
方还有一伙妖魔,咱们可没有时间追捕一匹普通的黑狼。”
“黑狼绝不普通。它认得弟弟,还能控制两只妖魔。”
古云极不耐烦了,厉声道:“两匹黑狼明显是妖魔抓来的猎物,何来黑狼控制妖魔
一说?狼性残忍,它咬死受伤的弟弟。正说明妖王已完全退化成兽,而且——你觉得我
的眼光差到这种地步,会放过一匹妖气缠身的狼吗?”
慕行秋忍了又忍,还是驳道:“当年漆无暇分离妖丹潜入庞山咫尺之外,也没有被
发现。”
田阡陌当时也在现场,而且就是因为这件事而被处以三年思过的惩罚,仰头干笑数
声,“原来如此,你以为妖魔还在处心积虑地夺取你的……真幻吗?这只是一次例行演
练,此地的妖魔都是五行科随机捉来的,难道你觉得五行科在陷害你吗?”
“我不怀疑五行科,可这匹黑狼并非特意安置于此的妖魔,它是自己跑来的,这种
事……”
古云极扭头看了一眼负手遥望东北方的申忌夷,说:“好吧,都是我的错,我不该
指责慕行秋道友判断失误,咱们还是准备剿除东北方的妖魔吧,别在这里耽误时间。”
其他几个立刻应和,慕行秋没法再争,既恼火于五行科道士的排挤,又有点后悔早
些时候放走黑狼,在几名道士的包围之内,蝉翼妖无处可逃,黑狼身上没有妖气,一旦
隐藏起来反而不好找。
有一句话他藏在心里没说,这时越想越觉得黑狼似乎记得自己,他曾经在牧马谷阻
止黑狼咬死褐鹿,喂它吃过檀羊肉,可黑狼不仅不感恩,眼神中还充满了仇恨,这可不
像是普通动物的反应。
慕行秋心绪开小差,没听到其他人商量除妖的事情,直到田阡陌叫他的名字才反应
过来,“慕行秋道友,你同意吗?”
“呃,同意。”
“好,那咱们就采用奇袭战法,由慕行秋道友担任主攻,我负责掩护,其他人留守
后方,这就出发吧。”
田阡陌等人总共没说几句话,居然这么快就改变了战法,慕行秋很意外,但他不会
退却,点点头,准备向东北方出发。
极少开口的申忌夷转身说话了,“你们真要采取奇袭战法?”
牙山道士遥望东北方已久,对那边的妖气颇有了解,田阡陌的眼珠左右移动了两次
,坚定地说:“既然是演练,就不能总用同一种战法。”
申忌夷点点头,似乎觉得这个说话很有道理,闪身让开,在慕行秋身上多看了两眼
avatar
c*y
4
前几天看到大家讨论系统生物学,跟风问一个统计在其中的作用。
现在系统生物学产生海量数据,基因的,蛋白的,小分子的。
然后,用各种统计办法建模,有的找bio-marker,更有甚者直接Network
Reconstruction
但是我觉得有一个问题,一般来说系统生物学都是小样本,一般也就10个左右sample然
后分析大到上万
的基因,小到几百个小分子,在这样的情况下,我觉得任何统计方法都是不稳定的,重
复性极差的,因
为样本相对变量太小了,可是这种paper却是一堆堆的发
不知道是我的理解有问题,还是做统计的忽悠生物人,然后生物人也欣然接受文章好看
就行。
avatar
s*s
5
这个 title 有什么问题莫?有什么实质的含义莫, 我是没看出来
如果头衔是什么架构工程师, 什么主任工程师, 你震精一下还情有可原吧

【在 k**n 的大作中提到】
: 还以为是新来的本科intern,
: 结果给我发email的Title吓我一跳。
: Software Engineering Team Leader
: Agile Competence Center Ambassador, Scrum Master

avatar
G*1
6
印度文学、音乐、美术、舞蹈大师级的人物挺多的。中国国内啥时候能搞点这种水平的。

【在 w******o 的大作中提到】
: 歌词:
: My Eye, The apple of my eye, Rest your eyes and sleep
: Oh Flower Are you a Peacock?
: Peacock with beautiful feathers?
: Are you a Nightingale
: Nightingale that sings beautifully
: Are you the Moon?
: Are you the light of the Moon?
: Are you the eyelid?
: Are you the dream inside those eyelids?

avatar
y*i
7
没人欣然吧。看看引用就知道了。现在就是做系统生物学的(做network的)自己玩
得不亦乐乎,你看有哪个做benchwork的跟过去的。

【在 c****y 的大作中提到】
: 前几天看到大家讨论系统生物学,跟风问一个统计在其中的作用。
: 现在系统生物学产生海量数据,基因的,蛋白的,小分子的。
: 然后,用各种统计办法建模,有的找bio-marker,更有甚者直接Network
: Reconstruction
: 但是我觉得有一个问题,一般来说系统生物学都是小样本,一般也就10个左右sample然
: 后分析大到上万
: 的基因,小到几百个小分子,在这样的情况下,我觉得任何统计方法都是不稳定的,重
: 复性极差的,因
: 为样本相对变量太小了,可是这种paper却是一堆堆的发
: 不知道是我的理解有问题,还是做统计的忽悠生物人,然后生物人也欣然接受文章好看

avatar
l*a
8
楼主有点少见多怪了
那你要看到银行出来的一堆小屁孩都挂着VP title,不要被吓死?
avatar
h*n
9
我听过的印度慢歌都是这种调调。
我在新加坡小印度的一家旅馆住过两礼拜,每天早晨天刚亮窗外就会飘来这种歌声,你
这视频又触发了我的回忆啊。

【在 w******o 的大作中提到】
: 歌词:
: My Eye, The apple of my eye, Rest your eyes and sleep
: Oh Flower Are you a Peacock?
: Peacock with beautiful feathers?
: Are you a Nightingale
: Nightingale that sings beautifully
: Are you the Moon?
: Are you the light of the Moon?
: Are you the eyelid?
: Are you the dream inside those eyelids?

avatar
c*y
10
还是有点吧 比如随便针对一个病,做个基因组,蛋白组,或者代谢组其中一个,然后
用个统计方法,
然后找出一堆所谓的bio-marker,然后再去找已知pathway,把自己找出来的marker往
上边靠,讲
故事。

【在 y***i 的大作中提到】
: 没人欣然吧。看看引用就知道了。现在就是做系统生物学的(做network的)自己玩
: 得不亦乐乎,你看有哪个做benchwork的跟过去的。

avatar
T*r
11
逻辑,纯粹两回事

★ 发自iPhone App: ChineseWeb 8.6

【在 l******a 的大作中提到】
: 楼主有点少见多怪了
: 那你要看到银行出来的一堆小屁孩都挂着VP title,不要被吓死?

avatar
p*c
12
如诗如梦,我看了两遍,其中的一个原因就是喜欢影片开头如梦幻般让人心碎(因为和
后面的对比)的天然之美。所以特别理解中国人一代代只求岁月静好,平淡是真的生活
理想。

【在 w******o 的大作中提到】
: 歌词:
: My Eye, The apple of my eye, Rest your eyes and sleep
: Oh Flower Are you a Peacock?
: Peacock with beautiful feathers?
: Are you a Nightingale
: Nightingale that sings beautifully
: Are you the Moon?
: Are you the light of the Moon?
: Are you the eyelid?
: Are you the dream inside those eyelids?

avatar
i*e
13
nod
常规套路

【在 c****y 的大作中提到】
: 还是有点吧 比如随便针对一个病,做个基因组,蛋白组,或者代谢组其中一个,然后
: 用个统计方法,
: 然后找出一堆所谓的bio-marker,然后再去找已知pathway,把自己找出来的marker往
: 上边靠,讲
: 故事。

avatar
g*s
14
Ambassador, Scrum Master 这是空的
avatar
s*f
15
是好听啊,让我又回想起片头的动物园的镜头,只有那个时候我才注意3D来着。:P
avatar
l*m
16
我就是做system biology的,任务主要分成两部分
1. 和真正做实验的人合作,这部分要求用比较成熟简单直观的方法,得到相对准确的
可以使用的结果,留给做实验的人去验证,如果装大运撞上了就有篇生物为主的论文,
我们一般要到456作者了。
2.自娱自乐的部分,用花哨一点的model,得到天花乱坠的结果,讲个故事,发一个计
算为主的论文。
两部分基本上是完全分开的,1主要是用现成的软件实现的,2要完全自己的算法。
由于理论要求的假设条件通常不100%的满足,所以统计的结果多数情况下有很大偏差。
不过即使这样的统计结果也总好过肉眼肉脑子一个一个的比照分析。
avatar
k*n
17
后来发现teamleader 也是空的..就一consultant ..

【在 g********s 的大作中提到】
: Ambassador, Scrum Master 这是空的
avatar
c*g
18
这是泰米尔歌曲。

的。

【在 G*******1 的大作中提到】
: 印度文学、音乐、美术、舞蹈大师级的人物挺多的。中国国内啥时候能搞点这种水平的。
avatar
b*l
19
几万个基因那也是样本啊,同学,一样提供自由度的。可以把几万个基因的海量自由度
拆借到 sample 的自由度上去。大致有两类拆借方式,一类是直接拆借,衍生出一系列
的 t-test 方法;另一类是寻找 gene set,也就是 GSEA 了。
至于重复性如何,要用数据说话。有些 marker 的重复性那是相当的好。

【在 c****y 的大作中提到】
: 前几天看到大家讨论系统生物学,跟风问一个统计在其中的作用。
: 现在系统生物学产生海量数据,基因的,蛋白的,小分子的。
: 然后,用各种统计办法建模,有的找bio-marker,更有甚者直接Network
: Reconstruction
: 但是我觉得有一个问题,一般来说系统生物学都是小样本,一般也就10个左右sample然
: 后分析大到上万
: 的基因,小到几百个小分子,在这样的情况下,我觉得任何统计方法都是不稳定的,重
: 复性极差的,因
: 为样本相对变量太小了,可是这种paper却是一堆堆的发
: 不知道是我的理解有问题,还是做统计的忽悠生物人,然后生物人也欣然接受文章好看

avatar
p*r
20
21岁,在念大学给揽一个研究所的活
给人的名片的title印得是CEO。
23岁毕业后进了一个小公司的title是CTO,
现在名片上啥title都没,悲剧啊
avatar
B*e
21
同意至极 这歌听了很舒服 软软的 很好听
avatar
c*y
22
谢谢回答 我没有说你们做的没意义,因为就像你说的总比没有好
我的主要问题是,在样本小,变量多的时候,统计方法是不是非常不reliable 如果是
这样那为啥向我
前面说的 找个病一做就发文章,我觉得这样没有任何意义,因为重复性很低

【在 l****m 的大作中提到】
: 我就是做system biology的,任务主要分成两部分
: 1. 和真正做实验的人合作,这部分要求用比较成熟简单直观的方法,得到相对准确的
: 可以使用的结果,留给做实验的人去验证,如果装大运撞上了就有篇生物为主的论文,
: 我们一般要到456作者了。
: 2.自娱自乐的部分,用花哨一点的model,得到天花乱坠的结果,讲个故事,发一个计
: 算为主的论文。
: 两部分基本上是完全分开的,1主要是用现成的软件实现的,2要完全自己的算法。
: 由于理论要求的假设条件通常不100%的满足,所以统计的结果多数情况下有很大偏差。
: 不过即使这样的统计结果也总好过肉眼肉脑子一个一个的比照分析。

avatar
j*n
23
这是在BSO吗?仁兄名片上可以这样印:
I'm PKER, Bitch!

【在 p**r 的大作中提到】
: 21岁,在念大学给揽一个研究所的活
: 给人的名片的title印得是CEO。
: 23岁毕业后进了一个小公司的title是CTO,
: 现在名片上啥title都没,悲剧啊

avatar
B*e
24
对 片头的斑马 红鹤 黑熊 还有一些其他动物 都是在台北木栅动物园花了两天时间
拍摄的
avatar
c*y
25
基因是变量 为何是样本?

【在 b*****l 的大作中提到】
: 几万个基因那也是样本啊,同学,一样提供自由度的。可以把几万个基因的海量自由度
: 拆借到 sample 的自由度上去。大致有两类拆借方式,一类是直接拆借,衍生出一系列
: 的 t-test 方法;另一类是寻找 gene set,也就是 GSEA 了。
: 至于重复性如何,要用数据说话。有些 marker 的重复性那是相当的好。

avatar
a*8
26
老美都喜欢吹 未必是真的 说不定自封的
avatar
c*y
27
http://www.nature.com/ng/journal/v36/n7/full/ng0704-663a.html

【在 b*****l 的大作中提到】
: 几万个基因那也是样本啊,同学,一样提供自由度的。可以把几万个基因的海量自由度
: 拆借到 sample 的自由度上去。大致有两类拆借方式,一类是直接拆借,衍生出一系列
: 的 t-test 方法;另一类是寻找 gene set,也就是 GSEA 了。
: 至于重复性如何,要用数据说话。有些 marker 的重复性那是相当的好。

avatar
b*l
28
比如说,三个策略,第一个策略是寻找 DEGs,那么每个 gene 都是独立的;第二个策
略是寻找 pathway,那么一系列的基因就是相互联系的;第三个策略是寻找 gene
expression pattern,这些基因也是相互联系的,但其机制有可能已知,有可能未知。
第二种策略是 a priori 的,第三种策略是 posteriori 的。
哪怕第一种策略,也可以寻找 gene-wise 的 pattern,比如说 Wright & Simon 2003
就提出每个 gene 的 std^2 放在一起,服从 Gamma 分布,从而把拟合所得的 Gamma
分布的 a 值拆借到了F-test 里去,或者用来修饰 t-test 的 sigma 的自由度。他们
给的例子中,a = 3.x,也就是说,总共可以拆借 2a = 6.x 到 sample size 去。考虑
到做 microarrays 时 n 一般也就 3-5,这个拆借过来的值已经很可观了。

【在 c****y 的大作中提到】
: 基因是变量 为何是样本?
avatar
c*y
29
我不太懂这个。基因是你研究的对象。把要研究的对象变量 独立或者不独立 的基因全
部放在一起变成
gamma分布这本身的legitimacy 存在吗。

2003

【在 b*****l 的大作中提到】
: 比如说,三个策略,第一个策略是寻找 DEGs,那么每个 gene 都是独立的;第二个策
: 略是寻找 pathway,那么一系列的基因就是相互联系的;第三个策略是寻找 gene
: expression pattern,这些基因也是相互联系的,但其机制有可能已知,有可能未知。
: 第二种策略是 a priori 的,第三种策略是 posteriori 的。
: 哪怕第一种策略,也可以寻找 gene-wise 的 pattern,比如说 Wright & Simon 2003
: 就提出每个 gene 的 std^2 放在一起,服从 Gamma 分布,从而把拟合所得的 Gamma
: 分布的 a 值拆借到了F-test 里去,或者用来修饰 t-test 的 sigma 的自由度。他们
: 给的例子中,a = 3.x,也就是说,总共可以拆借 2a = 6.x 到 sample size 去。考虑
: 到做 microarrays 时 n 一般也就 3-5,这个拆借过来的值已经很可观了。

avatar
b*l
30
从生物学的角度来说,最好的 microarray data 应当符合两点:1、DEGs 只占很小的比例,也就是说,可以认为 microarray 的分布都是一致的,并且总的来说个基因间相互独立;
2、DEGs 之间是有内在联系的。目前的方法多基于这两点假设。因为绝大部分基因的内在联系没有哪个是 dominating 的,因而可以近似认为 independent。
当然了,legitimacy 来自于实验数据的验证。
所以我就一直搞不懂为啥做代谢什么的,两万多个 genes,使用常规方法,整出个四五千的 DEGs,怎么还能发 paper 而不被 reject。。。明显有某几个 underlying relations 是 dominating 的么,好歹也要换个统计方法啊。

【在 c****y 的大作中提到】
: 我不太懂这个。基因是你研究的对象。把要研究的对象变量 独立或者不独立 的基因全
: 部放在一起变成
: gamma分布这本身的legitimacy 存在吗。
:
: 2003

avatar
D*a
31
我跟楼主有一样的问题, 怎么把基因拆借到样本量上去?
比如我们做老鼠,如果弄十只老鼠测测身高,测测体重,测测血液ABCDEF物质含量,想
就这样发了文章,肯定会被骂死,因为测来测去都是只代表十只老鼠啊
系统生物学弄十个人来测上万个基因,应该也是一样的道理吧。
avatar
y*i
32
What's 拆借?

【在 D*a 的大作中提到】
: 我跟楼主有一样的问题, 怎么把基因拆借到样本量上去?
: 比如我们做老鼠,如果弄十只老鼠测测身高,测测体重,测测血液ABCDEF物质含量,想
: 就这样发了文章,肯定会被骂死,因为测来测去都是只代表十只老鼠啊
: 系统生物学弄十个人来测上万个基因,应该也是一样的道理吧。

avatar
b*l
33
这个质疑的是算法的稳定性,而不是概念本身。其实说到这个,IPA 那个找 pathway
的算法更是搞笑,连具体数值都不看,只数个数。。。当然了,也在改善中。
我觉得可能还是 posteriori 的方法更靠谱些。。。或者搞搞基于 Bayes model 的算
法。

【在 c****y 的大作中提到】
: http://www.nature.com/ng/journal/v36/n7/full/ng0704-663a.html
avatar
c*y
34
没错
我就是问稳定性,不管概念多好,对创新没有稳定性的话也就是没有 预测性 没有预
测性这样的算法的
意义就不大了,当然了发文章肯定够了,我只是说在用算法指导实验上基本是无用的并
且mis-leading

另外,能稍微说下IPA的算法吗,怎么个数个数

【在 b*****l 的大作中提到】
: 这个质疑的是算法的稳定性,而不是概念本身。其实说到这个,IPA 那个找 pathway
: 的算法更是搞笑,连具体数值都不看,只数个数。。。当然了,也在改善中。
: 我觉得可能还是 posteriori 的方法更靠谱些。。。或者搞搞基于 Bayes model 的算
: 法。

avatar
b*l
35
当某个维度上的样本数目足够大,以至于可以比较稳定和精确地确定其分布时,情况就
不一样了。。。
当然了,当 microarray 便宜得大家可以几十个几十个做着玩儿时,也就不必遭罪用统
计方法穷算计了。现在这些统计方法呢,大约可以寄调一首《醉太平》:
夺泥燕口,削铁针头,刮金佛面细搜求,无中觅有。
鹌鹑嗉里寻豌豆,鹭鸶腿上劈精肉。蚊子腹内刳脂油,亏老先生下手。

【在 D*a 的大作中提到】
: 我跟楼主有一样的问题, 怎么把基因拆借到样本量上去?
: 比如我们做老鼠,如果弄十只老鼠测测身高,测测体重,测测血液ABCDEF物质含量,想
: 就这样发了文章,肯定会被骂死,因为测来测去都是只代表十只老鼠啊
: 系统生物学弄十个人来测上万个基因,应该也是一样的道理吧。

avatar
b*l
36
稳定性可以改进么,概念上问题还是不大的。
IPA 的算法,说来 ft:先给个 pathway,数出里面 protein 的个数(比如说 n),然
后看 DEGs 里面出现了多少个(比如说 m),那么 m/n 就是这个 pathway 的 index。。
。这还不如 GSEA 的算法靠谱呢。
后来据说他们也要开始考虑每个 protein 的 fold change 了。。。

【在 c****y 的大作中提到】
: 没错
: 我就是问稳定性,不管概念多好,对创新没有稳定性的话也就是没有 预测性 没有预
: 测性这样的算法的
: 意义就不大了,当然了发文章肯定够了,我只是说在用算法指导实验上基本是无用的并
: 且mis-leading
: 的
: 另外,能稍微说下IPA的算法吗,怎么个数个数

avatar
c*y
37
我看IPA到处打广告
他们就这状态 能卖出钱来吗
我看应该请这位兄台去做CSO ;)

【在 b*****l 的大作中提到】
: 稳定性可以改进么,概念上问题还是不大的。
: IPA 的算法,说来 ft:先给个 pathway,数出里面 protein 的个数(比如说 n),然
: 后看 DEGs 里面出现了多少个(比如说 m),那么 m/n 就是这个 pathway 的 index。。
: 。这还不如 GSEA 的算法靠谱呢。
: 后来据说他们也要开始考虑每个 protein 的 fold change 了。。。

avatar
b*l
38
他们的文献问题也很大,经常不准确,每个 connection 所依据的文献都需要自己再快
速读一下。不过总好过自己把汪洋大海般的文献捞一遍针吧。IPA 的重要之处,不是
make it perfect,而是 make it possible。我们这里用户们都在抱怨 license 数目
太少,不够用。

【在 c****y 的大作中提到】
: 我看IPA到处打广告
: 他们就这状态 能卖出钱来吗
: 我看应该请这位兄台去做CSO ;)

avatar
D*a
39
我哪知道,河马说的、、、

【在 y***i 的大作中提到】
: What's 拆借?
avatar
D*a
40
这里维度指什么?
什么叫“比较稳定和精确地确定其分布”?
其实对这个系统生物学挺好奇的

【在 b*****l 的大作中提到】
: 当某个维度上的样本数目足够大,以至于可以比较稳定和精确地确定其分布时,情况就
: 不一样了。。。
: 当然了,当 microarray 便宜得大家可以几十个几十个做着玩儿时,也就不必遭罪用统
: 计方法穷算计了。现在这些统计方法呢,大约可以寄调一首《醉太平》:
: 夺泥燕口,削铁针头,刮金佛面细搜求,无中觅有。
: 鹌鹑嗉里寻豌豆,鹭鸶腿上劈精肉。蚊子腹内刳脂油,亏老先生下手。

avatar
D*r
41
统计学里有两大阵营frequentist和bayesian
对后者来说,任何数据都是有用的,哪怕样本再小
就好象我们人经常通过一件事也能下一些有用的结论

【在 c****y 的大作中提到】
: 前几天看到大家讨论系统生物学,跟风问一个统计在其中的作用。
: 现在系统生物学产生海量数据,基因的,蛋白的,小分子的。
: 然后,用各种统计办法建模,有的找bio-marker,更有甚者直接Network
: Reconstruction
: 但是我觉得有一个问题,一般来说系统生物学都是小样本,一般也就10个左右sample然
: 后分析大到上万
: 的基因,小到几百个小分子,在这样的情况下,我觉得任何统计方法都是不稳定的,重
: 复性极差的,因
: 为样本相对变量太小了,可是这种paper却是一堆堆的发
: 不知道是我的理解有问题,还是做统计的忽悠生物人,然后生物人也欣然接受文章好看

avatar
c*y
42
bayesian 需要先后验概率吧 这本身就是对于未知的东西就是个问题
而且确实现在很多人用baysian network 去model 真个生物network 但是有成功的例子
吗?
比如从海量数据里面预测出一个以前不知道的pathway,然后实验也能证实

【在 D***r 的大作中提到】
: 统计学里有两大阵营frequentist和bayesian
: 对后者来说,任何数据都是有用的,哪怕样本再小
: 就好象我们人经常通过一件事也能下一些有用的结论

avatar
S*l
43
现在没有能预测pathway的。只能预测没有direction的一些protein function,
relationship罢了。

【在 c****y 的大作中提到】
: bayesian 需要先后验概率吧 这本身就是对于未知的东西就是个问题
: 而且确实现在很多人用baysian network 去model 真个生物network 但是有成功的例子
: 吗?
: 比如从海量数据里面预测出一个以前不知道的pathway,然后实验也能证实

avatar
b*l
44
在 sample 这个维度上:比如说,做 t-test,是多个 sample,少数几个 variable,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
microarray data 正好相反,sample 数目少,而 variable 数目多,那么在每个 sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。
另外,这个也不是系统生物学,而是生物信息学,bioinformatics。唉,systems
biology 啊,多少忽悠借你之名而行。。。

【在 D*a 的大作中提到】
: 这里维度指什么?
: 什么叫“比较稳定和精确地确定其分布”?
: 其实对这个系统生物学挺好奇的

avatar
D*a
45
也就是说,这个microarray这样几万个基因测下来,给的是精确的这几个人的信息,但
是代表population还是有限。如果有条件的话,还是应该加大sample size(测的人数
)了。

,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所
以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有
问题。
sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把
得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率
很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。

【在 b*****l 的大作中提到】
: 在 sample 这个维度上:比如说,做 t-test,是多个 sample,少数几个 variable,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
: microarray data 正好相反,sample 数目少,而 variable 数目多,那么在每个 sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。
: 另外,这个也不是系统生物学,而是生物信息学,bioinformatics。唉,systems
: biology 啊,多少忽悠借你之名而行。。。

avatar
c*y
46
兄台相当透彻
但是,生物信息学是系统生物学的重要组成部分呀 照目前的发展趋势,没有信息学都
不敢叫自己是系统
生物学了 :)

,先检验
每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当
sample size
很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
sample
内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信
息拆借回
sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自
由度,拆借过来
只有几个自由度,甚至 even worse。

【在 b*****l 的大作中提到】
: 在 sample 这个维度上:比如说,做 t-test,是多个 sample,少数几个 variable,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
: microarray data 正好相反,sample 数目少,而 variable 数目多,那么在每个 sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。
: 另外,这个也不是系统生物学,而是生物信息学,bioinformatics。唉,systems
: biology 啊,多少忽悠借你之名而行。。。

avatar
a*k
47
完全不明白“在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得
到的信息拆借回
sample 维度上。”
有没有文献可以推荐呢。

,先检验每
个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample
size 很
小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
sample 内
部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息
拆借回 sample
维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆
借过来只有几个
自由度,甚至 even worse。

【在 b*****l 的大作中提到】
: 在 sample 这个维度上:比如说,做 t-test,是多个 sample,少数几个 variable,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
: microarray data 正好相反,sample 数目少,而 variable 数目多,那么在每个 sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。
: 另外,这个也不是系统生物学,而是生物信息学,bioinformatics。唉,systems
: biology 啊,多少忽悠借你之名而行。。。

avatar
a*k
48
展开说说“这个也不是系统生物学,而是生物信息学”?拜谢了。

,先检验每
个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample
size 很
小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
sample 内
部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息
拆借回 sample
维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆
借过来只有几个
自由度,甚至 even worse。

【在 b*****l 的大作中提到】
: 在 sample 这个维度上:比如说,做 t-test,是多个 sample,少数几个 variable,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
: microarray data 正好相反,sample 数目少,而 variable 数目多,那么在每个 sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。
: 另外,这个也不是系统生物学,而是生物信息学,bioinformatics。唉,systems
: biology 啊,多少忽悠借你之名而行。。。

avatar
s*s
49
同求相关的文献或书,谢谢!

sample

【在 a******k 的大作中提到】
: 完全不明白“在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把得
: 到的信息拆借回
: sample 维度上。”
: 有没有文献可以推荐呢。
:
: ,先检验每
: 个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所以当 sample
: size 很
: 小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有问题。
: sample 内

avatar
h*g
50
数据量足够大的话还是很有可能的。Science 2005年有一篇,很经典

【在 c****y 的大作中提到】
: bayesian 需要先后验概率吧 这本身就是对于未知的东西就是个问题
: 而且确实现在很多人用baysian network 去model 真个生物network 但是有成功的例子
: 吗?
: 比如从海量数据里面预测出一个以前不知道的pathway,然后实验也能证实

avatar
c*y
51
请看 10楼
不过,愚钝的我觉得这个办法肯定不好用,因为仅仅是提高自由度,其他啥都没解决
呵呵

【在 s******s 的大作中提到】
: 同求相关的文献或书,谢谢!
:
: sample

avatar
c*y
52
能给一下 titile嘛 我看看多大的sample size
谢谢
我就在这问 样本多大才有可能得出比较靠谱的结论

【在 h*****g 的大作中提到】
: 数据量足够大的话还是很有可能的。Science 2005年有一篇,很经典
avatar
K*S
53
you need validation after the initial screening, no matter the markers are
DNA or proteins.

【在 c****y 的大作中提到】
: 谢谢回答 我没有说你们做的没意义,因为就像你说的总比没有好
: 我的主要问题是,在样本小,变量多的时候,统计方法是不是非常不reliable 如果是
: 这样那为啥向我
: 前面说的 找个病一做就发文章,我觉得这样没有任何意义,因为重复性很低

avatar
s*s
54
关于presumption和independency能展开说说吗?或者有什么文献比较详细?
最近正在做的project就得出几千个differentially expressed genes, 不知道如何后
续处
理。因为candidate太多了。

的比例,也
就是说,可以认为 microarray 的分布都是一致的,并且总的来说个基因间相互独立;
内在联系没有哪
个是 dominating 的,因而可以近似认为 independent。
五千的
DEGs,怎么还能发 paper 而不被 reject。。。明显有某几个 underlying relations

dominating 的么,好歹也要换个统计方法啊。

【在 b*****l 的大作中提到】
: 从生物学的角度来说,最好的 microarray data 应当符合两点:1、DEGs 只占很小的比例,也就是说,可以认为 microarray 的分布都是一致的,并且总的来说个基因间相互独立;
: 2、DEGs 之间是有内在联系的。目前的方法多基于这两点假设。因为绝大部分基因的内在联系没有哪个是 dominating 的,因而可以近似认为 independent。
: 当然了,legitimacy 来自于实验数据的验证。
: 所以我就一直搞不懂为啥做代谢什么的,两万多个 genes,使用常规方法,整出个四五千的 DEGs,怎么还能发 paper 而不被 reject。。。明显有某几个 underlying relations 是 dominating 的么,好歹也要换个统计方法啊。

avatar
l*u
55
IPA 还是挺有用的, 我挑了 canonical pathway 上的第一个, IHC 验证的超好,
背后的生物学故事也很完美.

relations

【在 s******s 的大作中提到】
: 关于presumption和independency能展开说说吗?或者有什么文献比较详细?
: 最近正在做的project就得出几千个differentially expressed genes, 不知道如何后
: 续处
: 理。因为candidate太多了。
:
: 的比例,也
: 就是说,可以认为 microarray 的分布都是一致的,并且总的来说个基因间相互独立;
: 内在联系没有哪
: 个是 dominating 的,因而可以近似认为 independent。
: 五千的

avatar
c*y
56
想请教下IPA的用法。IPA整理别人做出来的pathway,我们做实验都想找别人不知道的
,这样才有创
新性。
即使用IPA找到一个pathway被你所研究的疾病或者情况影响了,也不能说明这个
pathway对你研究的
问题有专属性
生物体正常的pathway在疾病或者别的情况下,很容易都会受到影响,这应该是很正常
的现象呀

【在 l******u 的大作中提到】
: IPA 还是挺有用的, 我挑了 canonical pathway 上的第一个, IHC 验证的超好,
: 背后的生物学故事也很完美.
:
: relations

avatar
l*u
57
我做的是病人样本. 用laser microdissection 切取俩相邻的细胞群(A & B),
然后做microarray 看trancpitone, 在IPA发现某代谢的pathway 在A里很高,
详细看发现这个代谢的pathway 最重要的合成酶在A里几乎都高表达在B里不表达.
然后发现这个代谢pathwway的主要产物的受体在B里高表达而在A里不表达,这样就发现了
这个pathway在这俩相邻细胞群的interaction里起非常重要的作用.
A细胞的代谢产物(小分子)通过ECM里跑到B细胞那边发生了interaction.
(几个重要的酶和受体都在IHC得到很好的验证)
做cell biolgoy的人对pathway的理解其实跟做genomics的很不一样. pathway受影响
是正常啊. 但是假设, 前人发现ABCDpathway 在疾病X 里很重要, 但是不一定知道
pathway F 也在疾病X里很重要, 并且不知道跟 pathway ABCD 有interaction,
如果你通过一些生物信息的工具
找到了 F, 并且有些hint 告诉你 F 跟 ABCD 有interaction, 这个也是很有意思的发
现.

【在 c****y 的大作中提到】
: 想请教下IPA的用法。IPA整理别人做出来的pathway,我们做实验都想找别人不知道的
: ,这样才有创
: 新性。
: 即使用IPA找到一个pathway被你所研究的疾病或者情况影响了,也不能说明这个
: pathway对你研究的
: 问题有专属性
: 生物体正常的pathway在疾病或者别的情况下,很容易都会受到影响,这应该是很正常
: 的现象呀

avatar
b*l
58
做 cell line 的重复性比较好,sample size 不用很大。要是做 patient,怎么也得
几十上百的 sample size 吧。光是 subtype 就够受的,经常几百组数据处理下来,罕
见些的 subtype 还是 sample size 太小。不过只要控制好 FDR,sample size 的问题
只会导致无法找到 DEGs 而已。
所以我总觉得 DEG screening 还是 wet lab 的人做比较好,因为找出来的 DEGs 自己
要亲自 validate,所以会更严谨。毕竟 dry lab 忽悠得是别人,web lab 忽悠的是自
己。

【在 D*a 的大作中提到】
: 也就是说,这个microarray这样几万个基因测下来,给的是精确的这几个人的信息,但
: 是代表population还是有限。如果有条件的话,还是应该加大sample size(测的人数
: )了。
:
: ,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所
: 以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有
: 问题。
: sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把
: 得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率
: 很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。

avatar
b*l
59
如果 FDR 控制得没问题,而且 DEG 引起的分布偏移导致的 bias 也得到了矫正的话,
我觉得下一步可能要用别的 bioinformatics 的工具来寻找 driver genes 了。关于筛
选 driver gene/passenger gene/driving network 可能没有很成熟的工具,恐怕得找
专门做 bioinformatics 的组来合作。

relations

【在 s******s 的大作中提到】
: 关于presumption和independency能展开说说吗?或者有什么文献比较详细?
: 最近正在做的project就得出几千个differentially expressed genes, 不知道如何后
: 续处
: 理。因为candidate太多了。
:
: 的比例,也
: 就是说,可以认为 microarray 的分布都是一致的,并且总的来说个基因间相互独立;
: 内在联系没有哪
: 个是 dominating 的,因而可以近似认为 independent。
: 五千的

avatar
a*g
60
白猫黑猫抓住老鼠就是好猫
只要有用,就是好的
另外, 统计学 是 伪科学
avatar
G*y
61
这个帖子信息量不小么.

【在 c****y 的大作中提到】
: 前几天看到大家讨论系统生物学,跟风问一个统计在其中的作用。
: 现在系统生物学产生海量数据,基因的,蛋白的,小分子的。
: 然后,用各种统计办法建模,有的找bio-marker,更有甚者直接Network
: Reconstruction
: 但是我觉得有一个问题,一般来说系统生物学都是小样本,一般也就10个左右sample然
: 后分析大到上万
: 的基因,小到几百个小分子,在这样的情况下,我觉得任何统计方法都是不稳定的,重
: 复性极差的,因
: 为样本相对变量太小了,可是这种paper却是一堆堆的发
: 不知道是我的理解有问题,还是做统计的忽悠生物人,然后生物人也欣然接受文章好看

avatar
c*y
62
我想再请教下
按照我的理解,细胞的pathway是一个网络,正常的情况下是平衡的。
当当病态的情况下,网络的某部分被破坏,必然会影响整个网络的动态平衡,所以很多
pathway都会
被影响到,所以用omics一测基本都能找出几百到几千个,表达变化的。
即使IPA帮你找出一个以前不知道的pathway,我觉得也没有任何意义,你怎么证明这个
pathway是
你研究这个病的specificity?
当然了,我知道文章都是这么发的,我只是从更严格的角度来提问

现了

【在 l******u 的大作中提到】
: 我做的是病人样本. 用laser microdissection 切取俩相邻的细胞群(A & B),
: 然后做microarray 看trancpitone, 在IPA发现某代谢的pathway 在A里很高,
: 详细看发现这个代谢的pathway 最重要的合成酶在A里几乎都高表达在B里不表达.
: 然后发现这个代谢pathwway的主要产物的受体在B里高表达而在A里不表达,这样就发现了
: 这个pathway在这俩相邻细胞群的interaction里起非常重要的作用.
: A细胞的代谢产物(小分子)通过ECM里跑到B细胞那边发生了interaction.
: (几个重要的酶和受体都在IHC得到很好的验证)
: 做cell biolgoy的人对pathway的理解其实跟做genomics的很不一样. pathway受影响
: 是正常啊. 但是假设, 前人发现ABCDpathway 在疾病X 里很重要, 但是不一定知道
: pathway F 也在疾病X里很重要, 并且不知道跟 pathway ABCD 有interaction,

avatar
l*u
63
如果你说到疾病,从clinical的意义上说,可以看这些Pathway/Network 一些重要基因对
这个疾病的 prognosis 的意义如何,这个在临床上的指导意义非常重要。
我曾经跟Zurich一个Pathologist 谈到现在 GWAS 在临床上的应用的指导
意义的时候,也问过类似的问题。他们说这些 GWAS 晒到的prognosis marker
对他们的工作有很大的指导意义。 而而Pathway/Network 本身成了paper需要的故事的
素材
个人觉得, IPA 不能帮你发现什么真正新的pathway, IPA的意义在于它集成了很多
前人研究的一些基因/蛋白的关系(有科学文献记载),而便于你研究这些相互关系网
络。我的理解可能还比较粗浅,bioinfor的高人可以再来补充。
我刚从human genomics的lab转到了mouse Lab, 发现做function study的人对pathway的
理解跟做genomics的人非常不一样。

【在 c****y 的大作中提到】
: 我想再请教下
: 按照我的理解,细胞的pathway是一个网络,正常的情况下是平衡的。
: 当当病态的情况下,网络的某部分被破坏,必然会影响整个网络的动态平衡,所以很多
: pathway都会
: 被影响到,所以用omics一测基本都能找出几百到几千个,表达变化的。
: 即使IPA帮你找出一个以前不知道的pathway,我觉得也没有任何意义,你怎么证明这个
: pathway是
: 你研究这个病的specificity?
: 当然了,我知道文章都是这么发的,我只是从更严格的角度来提问
:

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。