现在测序哪家强?能不能找蓝翔啊# Biology - 生物学s*y2015-10-08 07:101 楼华大倒是测得便宜,但是听说北美华大好像都快完犊子了。也有听说送国内去测的,感觉不靠谱中国的测序太多太杂了,一是不知道哪家强,二是对运输不放心。因为测得比较多de novo,测基因组,所以不得不考虑价格。北美测序哪家强啊
K*S2015-10-08 07:109 楼scienceexchange.com【在 s******y 的大作中提到】: 华大倒是测得便宜,但是听说北美华大好像都快完犊子了。: 也有听说送国内去测的,感觉不靠谱: 中国的测序太多太杂了,一是不知道哪家强,二是对运输不放心。: 因为测得比较多de novo,测基因组,所以不得不考虑价格。北美测序哪家强啊
s*s2015-10-08 07:1010 楼小声说一句,组里最近在重新分析各大center的data,问题百出啊,包括吹的最NB的Bxxxx Institute。【在 b****r 的大作中提到】: 送几个大高校genome center,不会离谱的
b*r2015-10-08 07:1011 楼Bxxxx ?没打错吗?是Bxx xx Institute?【在 s******s 的大作中提到】: 小声说一句,组里最近在重新分析各大center的data,问题百出啊,: 包括吹的最NB的Bxxxx Institute。
s*r2015-10-08 07:1012 楼hehe【在 s******s 的大作中提到】: 小声说一句,组里最近在重新分析各大center的data,问题百出啊,: 包括吹的最NB的Bxxxx Institute。
i*y2015-10-08 07:1013 楼展开说说,什么问题?原始数据还是分析?【在 s******s 的大作中提到】: 小声说一句,组里最近在重新分析各大center的data,问题百出啊,: 包括吹的最NB的Bxxxx Institute。
s*s2015-10-08 07:1014 楼原始数据啦。当然,我们做的比较仔细,检查的东西比较多,如果随便align一下,然后biobambam sort, merge, mkdup估计也就混过去了。当然,据说Bxxxx release出来的data不一定是他们内部用的,人内部的QC系统极端复杂。【在 i**********y 的大作中提到】: 展开说说,什么问题?原始数据还是分析?
s*s2015-10-08 07:1015 楼问题太多,比如说read group name和metadata不符合,library name不符合,或者干脆没有read group name。一条lane两个read group,其中一个质量奇差,怀疑是manufactory failed 的reads,还有不分read group,但是有failed reads。demultiplex有5%的cross contamination...。问题多的我都记不住。很多能fix, 很多我也没辙。我们DNA-Seq那个pipeline已经commit 400多次了,现在变成了一个无数branch的庞然大物,这还只是alignment。【在 i**********y 的大作中提到】: 展开说说,什么问题?原始数据还是分析?
s*s2015-10-08 07:1016 楼当然,还听说有各种各样的degradation pattern。 我还没看到这一步。oxidation有tool可以fix,其他的估计连原因都不知道【在 s******s 的大作中提到】: 问题太多,比如说read group name和metadata不符合,library name不符合,: 或者干脆没有read group name。一条lane两个read group,其中一个质量奇差,: 怀疑是manufactory failed 的reads,还有不分read group,但是有failed reads。: demultiplex有5%的cross contamination...。问题多的我都记不住。: 很多能fix, 很多我也没辙。我们DNA-Seq那个pipeline已经commit 400多次了,: 现在变成了一个无数branch的庞然大物,这还只是alignment。
s*y2015-10-08 07:1017 楼那看来真的让国内蓝翔干了,反正价格差不多是四分之一【在 s******s 的大作中提到】: 小声说一句,组里最近在重新分析各大center的data,问题百出啊,: 包括吹的最NB的Bxxxx Institute。
n*72015-10-08 07:1019 楼哈哈知道一些pan-cancer的会议,几大center一直在对答案,调pipeline【在 s******s 的大作中提到】: 小声说一句,组里最近在重新分析各大center的data,问题百出啊,: 包括吹的最NB的Bxxxx Institute。
n*72015-10-08 07:1020 楼很好奇你是哪个组的?绝大部分地方处理第三方data不会搞这么细致【在 s******s 的大作中提到】: 当然,还听说有各种各样的degradation pattern。 我还没看到这一步。: oxidation有tool可以fix,其他的估计连原因都不知道
b*r2015-10-08 07:1021 楼还以为国内哪家呢那还真挺意外的。这玩意照说也没那么复杂啊。而且很多大家都用到的算法不都是他们弄出来的吗,经过了大家的检验啊【在 n******7 的大作中提到】: Broad
s*s2015-10-08 07:1022 楼据说ICGC的专家们现在正在一头汗的QC呢【在 n******7 的大作中提到】: 哈哈: 知道一些pan-cancer的会议,几大center一直在对答案,调pipeline
s*s2015-10-08 07:1023 楼BWA MEM还是经过检验的。pipeline那种东西里面无数的tool,要说每个都像BWA那样壮实是不可能的。当然,不做QC一路biobambam sort/merge/mkdup混过去也是可以的,不过最后variant call估计要人肉看了,大project最后都是上人肉的【在 b****r 的大作中提到】: 还以为国内哪家呢: 那还真挺意外的。: 这玩意照说也没那么复杂啊。而且很多大家都用到的算法不都是他们弄出来的吗,经过: 了大家的检验啊
b*r2015-10-08 07:1024 楼clinical的话貌似新pipeline就是扔几个1000G的标本进去,看最后能出来多少,我觉得这个方法简单靠谱,就看愿不愿意花这个钱了【在 s******s 的大作中提到】: BWA MEM还是经过检验的。pipeline那种东西里面无数的tool,要说每个: 都像BWA那样壮实是不可能的。当然,不做QC一路biobambam sort/merge/mkdup: 混过去也是可以的,不过最后variant call估计要人肉看了,大project最后都是上人: 肉的
s*s2015-10-08 07:1025 楼1000g? 你吓死我了,我看到最大一个特例才900,正在头疼怎么搞呢。以后都是1000的,要多少时间去process 啊?btw,质量问题不是随机噪声靠reads多就能解决的。如果是bias,再多reads也没戏。【在 b****r 的大作中提到】: clinical的话貌似新pipeline就是扔几个1000G的标本进去,看最后能出来多少,我觉: 得这个方法简单靠谱,就看愿不愿意花这个钱了
n*72015-10-08 07:1026 楼是的前段时间参加ICGC的会议,大致就是这样感受就是,外围的组要玩转这些data,很难,各种坑都不跟你说的【在 s******s 的大作中提到】: 据说ICGC的专家们现在正在一头汗的QC呢
b*r2015-10-08 07:1027 楼one thousand genome的意思。。。这上千个人DNA是经过非常详细的测定和质控的,数据网上免费,DNA几十刀一个人的价格就可买到【在 s******s 的大作中提到】: 1000g? 你吓死我了,我看到最大一个特例才900,正在头疼怎么搞呢。以后都是1000的: ,要多少时间去process 啊?: btw,质量问题不是随机噪声靠reads多就能解决的。如果是bias,再多reads也没戏。
n*72015-10-08 07:1028 楼起码5年前的测序平台和pipeline了我不知道有多大参考价值我也参与过这个,不过做些下家分析,权当上游数据都没问题【在 b****r 的大作中提到】: one thousand genome的意思。。。这上千个人DNA是经过非常详细的测定和质控的,数: 据网上免费,DNA几十刀一个人的价格就可买到
s*s2015-10-08 07:1029 楼连ICGC都算不上内围。甚至几个Center的头都不一定知道,很多东西只有具体干活的人知道,我也是dig出来几个问题,给每个center发个email问,才一头瀑布汗啊。。。【在 n******7 的大作中提到】: 是的: 前段时间参加ICGC的会议,大致就是这样: 感受就是,外围的组要玩转这些data,很难,各种坑都不跟你说的
s*s2015-10-08 07:1030 楼原来你说的是1kg,我还以为每个要deep到1000 gb,吓着我了。【在 b****r 的大作中提到】: one thousand genome的意思。。。这上千个人DNA是经过非常详细的测定和质控的,数: 据网上免费,DNA几十刀一个人的价格就可买到
i*e2015-10-08 07:1032 楼是这样的,而且1KG用的LCL,low-pass wgs,这个bias可能不小有的组很不鸟1KG的数据【在 s******s 的大作中提到】: 原来你说的是1kg,我还以为每个要deep到1000 gb,吓着我了。
i*e2015-10-08 07:1033 楼看看那个ICGC-TCGA DREAM的东东,能不能最后给个大体的方案吧【在 n******7 的大作中提到】: 哈哈: 知道一些pan-cancer的会议,几大center一直在对答案,调pipeline
i*e2015-10-08 07:1034 楼起码要IGV图片出来人肉看【在 s******s 的大作中提到】: BWA MEM还是经过检验的。pipeline那种东西里面无数的tool,要说每个: 都像BWA那样壮实是不可能的。当然,不做QC一路biobambam sort/merge/mkdup: 混过去也是可以的,不过最后variant call估计要人肉看了,大project最后都是上人: 肉的