Redian新闻
>
illumina测序数据分析
avatar
f*w
2
电话号码怎么输啊
★ 发自iPhone App: ChineseWeb - 中文网站浏览器
avatar
s*2
3
我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
大了,老板还急着要结果。谢谢大家!
avatar
c*h
4
用email

★ 发自iPhone App: ChineseWeb - 中文网站浏览器

【在 f*******w 的大作中提到】
: 电话号码怎么输啊
: ★ 发自iPhone App: ChineseWeb - 中文网站浏览器

avatar
B*t
5
chip-seq? RNA-seq? You need a machine with huge memory. Ask somebody locally
, if you don't have machine to analyze.
avatar
b*r
6
+86<11位号码>
我就是这么发的。。

【在 f*******w 的大作中提到】
: 电话号码怎么输啊
: ★ 发自iPhone App: ChineseWeb - 中文网站浏览器

avatar
n*t
7
靠,没法分析为啥要测序?本校或当地找个合作者吧,这东西数据传输都是问题
avatar
N*3
8
这个比微信差远了,无论速度还是功能~
avatar
b*e
9
你们要分析啥呀?
推荐一个软件吧: clc genomics workbench
我只用这个做过很简单的分析,但是见过有人用它做454的assembly和注释等等,挺强
大的,不过不便宜,5000刀。
能试用14天,如果要继续用的话,好像改mac地址还是怎样操作来着,我忘了
比如可以导入你们的原始数据然后assembly,然后各种各样的分析。

【在 s********2 的大作中提到】
: 我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
: 学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
: 供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
: 大了,老板还急着要结果。谢谢大家!

avatar
d*y
10
如果你實驗室沒有服務器的話,比較麻煩。如果有服務器,你可以學著自己coding. 免
費得軟件很多的。
avatar
e*t
11
i could help you do the analysis. co-first author. deal or not deal?
avatar
e*e
12
what info are you trying to get out?

【在 s********2 的大作中提到】
: 我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
: 学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
: 供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
: 大了,老板还急着要结果。谢谢大家!

avatar
s*y
13
It's actually very simple.
If you have command-line experience (like DOS), try to use Bowtie and
cuffdiff. It only requires less than 2g memory for most genomes.
If not, try Galaxy http://main.g2.bx.psu.edu/. Free and very powerful.
avatar
L*a
14
如果完全新手又没有计算资源,找个合作者是最快出结果的方法了。
如果一定要自己搞:
(1)找个靠谱的cloud或其他cluster,把数据传上去。或者花2000多刀买一个work
station。16g内存,8cpu。
(2)找地方参加个workshop。对怎么分析这类数据有个大概的sense。
(3)知道哪些能用公共软件做,哪些需要自己coding,应该从哪些方面入手分析之后
,自己学coding,至少懂两样。perl/python 以及R。
这一套下来半年算很快了。还是在有人能时不时指导下的情况下。
avatar
L*a
15
外包也是个方法。
国内有很多做生物信息分析的小公司。
可以帮你用流程跑一下。给钱就行,不要求authorship。
当然流程跑出来的结果只能给你个大概的idea,就是这个数据大概长什么样。
最后还是得有个local或者非local但是能频繁交流的人一起边商量边搞。这个人最好就
是你自己。
avatar
s*2
16
是RAD——seq,我想找我们大学的做生物学信息分析方面的人,但是他们说他们的服务
器很忙,没空让我们用。所以很悲惨啊。

locally

【在 B*******t 的大作中提到】
: chip-seq? RNA-seq? You need a machine with huge memory. Ask somebody locally
: , if you don't have machine to analyze.

avatar
s*2
17
其实最终我都得想个解决分析的办法的。本校的实验室一些是不屑于跟我们合作。有些同
意合作的,但是服务器很忙,要等很长时间,我又等不及了。

【在 n********t 的大作中提到】
: 靠,没法分析为啥要测序?本校或当地找个合作者吧,这东西数据传输都是问题
avatar
S*l
18
可以用maq,免费的

【在 s********2 的大作中提到】
: 我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
: 学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
: 供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
: 大了,老板还急着要结果。谢谢大家!

avatar
s*2
19
谢谢! 我用illumina测序,每个lane里面有好几个个体,个体都加了barcode,我就是
想把这些序列根据barcode分配到不同的个体,然后再将每个个体的序列alignment,看
看有多少个unique的序列,然后再找SNP。目标挺简单的,还有现成的软件。但是现在
限制我的就是服务器的问题。头都大了。

【在 b*******e 的大作中提到】
: 你们要分析啥呀?
: 推荐一个软件吧: clc genomics workbench
: 我只用这个做过很简单的分析,但是见过有人用它做454的assembly和注释等等,挺强
: 大的,不过不便宜,5000刀。
: 能试用14天,如果要继续用的话,好像改mac地址还是怎样操作来着,我忘了
: 比如可以导入你们的原始数据然后assembly,然后各种各样的分析。

avatar
s*2
20
对呢,现在这个实验室没有服务器,我国内导师的实验室有服务器,我就是想拿到初步
数据,再做实验,再测序,然后将最后的测序结果拿到国内分析就行了,但是现在就卡
在这个初步结果的分析这步上了。并且,我还想赶紧做完,赶紧回国。

【在 d***y 的大作中提到】
: 如果你實驗室沒有服務器的話,比較麻煩。如果有服務器,你可以學著自己coding. 免
: 費得軟件很多的。

avatar
s*2
21
我用illumina测序,每个lane里面有好几个个体,个体都加了barcode,我就是
想把这些序列根据barcode分配到不同的个体,然后再将每个个体的序列alignment,看
看有多少个unique的序列,然后再找SNP。

【在 e****e 的大作中提到】
: what info are you trying to get out?
avatar
L*a
22
数据传回国内服务器,或者硬盘寄回去。
远程ssh到国内服务器上做。
如果是教育网,速度估计还可以。

【在 s********2 的大作中提到】
: 对呢,现在这个实验室没有服务器,我国内导师的实验室有服务器,我就是想拿到初步
: 数据,再做实验,再测序,然后将最后的测序结果拿到国内分析就行了,但是现在就卡
: 在这个初步结果的分析这步上了。并且,我还想赶紧做完,赶紧回国。

avatar
s*2
23
真的啊?!关于co-first author的问题,我可以跟我们导师申请。

【在 e*****t 的大作中提到】
: i could help you do the analysis. co-first author. deal or not deal?
avatar
s*2
24
真的啊?!关于co-first author的问题,我可以跟我们导师申请。

【在 e*****t 的大作中提到】
: i could help you do the analysis. co-first author. deal or not deal?
avatar
s*2
25
是,说的太对了。现在诺大的实验室,只有我自己是搞分子生物学的,遇到问题,就没
得商量的,除了导师。

【在 L*******a 的大作中提到】
: 外包也是个方法。
: 国内有很多做生物信息分析的小公司。
: 可以帮你用流程跑一下。给钱就行,不要求authorship。
: 当然流程跑出来的结果只能给你个大概的idea,就是这个数据大概长什么样。
: 最后还是得有个local或者非local但是能频繁交流的人一起边商量边搞。这个人最好就
: 是你自己。

avatar
s*2
26
现在还有个悲剧的问题,就是国内的服务器太繁忙了,好几个人在处理数据,我得等至
少一个月才行。我9月底就要回国了。我还要根据这些结果,在回国前完成一个实验才
行。并且那个实验要有一个月的时间才能完成,还是不出意外的情况。所以我现在是心
急如焚啊。

【在 L*******a 的大作中提到】
: 数据传回国内服务器,或者硬盘寄回去。
: 远程ssh到国内服务器上做。
: 如果是教育网,速度估计还可以。

avatar
L*a
27
这么急的话,签协议的外包是最靠铺的了。

【在 s********2 的大作中提到】
: 现在还有个悲剧的问题,就是国内的服务器太繁忙了,好几个人在处理数据,我得等至
: 少一个月才行。我9月底就要回国了。我还要根据这些结果,在回国前完成一个实验才
: 行。并且那个实验要有一个月的时间才能完成,还是不出意外的情况。所以我现在是心
: 急如焚啊。

avatar
s*2
28
嗯,所以如果有愿意帮忙的同胞,希望能够联系我。

【在 L*******a 的大作中提到】
: 这么急的话,签协议的外包是最靠铺的了。
avatar
o*r
29
你这个太杯具,还是赶快找一个已经建起pipeline的组合作,要自己做的话2个月都来
不及摸条件的。别以为软件可以直接用就很方便,不同的软件间可能根本不能直接对接
,比如BAM中用不用chr,排序的时候是1,10,11,...,2,20,21,22,3,...,9,X,Y还是1,2,..
.,9,10,11,...,22,X,Y(这几种居然都是常用的)都可能造成程序崩溃,更别提有些莫
名其妙的软件还有特殊的输入格式。。。另外每个软件都有一推各种各样的参数,不合
适的参数结果就是垃圾

【在 s********2 的大作中提到】
: 现在还有个悲剧的问题,就是国内的服务器太繁忙了,好几个人在处理数据,我得等至
: 少一个月才行。我9月底就要回国了。我还要根据这些结果,在回国前完成一个实验才
: 行。并且那个实验要有一个月的时间才能完成,还是不出意外的情况。所以我现在是心
: 急如焚啊。

avatar
t*d
30
请推荐几个吧。谢谢!

【在 L*******a 的大作中提到】
: 这么急的话,签协议的外包是最靠铺的了。
avatar
e*t
31
这个在linux下几个简单命令就能解决。

1,2,..

【在 o********r 的大作中提到】
: 你这个太杯具,还是赶快找一个已经建起pipeline的组合作,要自己做的话2个月都来
: 不及摸条件的。别以为软件可以直接用就很方便,不同的软件间可能根本不能直接对接
: ,比如BAM中用不用chr,排序的时候是1,10,11,...,2,20,21,22,3,...,9,X,Y还是1,2,..
: .,9,10,11,...,22,X,Y(这几种居然都是常用的)都可能造成程序崩溃,更别提有些莫
: 名其妙的软件还有特殊的输入格式。。。另外每个软件都有一推各种各样的参数,不合
: 适的参数结果就是垃圾

avatar
a*e
32
我现在在 ubuntu 和 cygwin 下编译 blat 都通不过, 还每搞定。
avatar
o*r
33
你可以试试(BAM是binary file)。

【在 e*****t 的大作中提到】
: 这个在linux下几个简单命令就能解决。
:
: 1,2,..

avatar
s*2
34
是啊,是挺悲剧的,我跟一些公司的人联系过,人家觉得我这分析太简单,不值得去做
,嫌光传数据就麻烦的够呛。我真是哭死了。所以才来像大家求助,看有没有做这方面
的同胞,如果花钱,或者当co-author都可以的。我就是在时间上比较着急。

1,2,..

【在 o********r 的大作中提到】
: 你这个太杯具,还是赶快找一个已经建起pipeline的组合作,要自己做的话2个月都来
: 不及摸条件的。别以为软件可以直接用就很方便,不同的软件间可能根本不能直接对接
: ,比如BAM中用不用chr,排序的时候是1,10,11,...,2,20,21,22,3,...,9,X,Y还是1,2,..
: .,9,10,11,...,22,X,Y(这几种居然都是常用的)都可能造成程序崩溃,更别提有些莫
: 名其妙的软件还有特殊的输入格式。。。另外每个软件都有一推各种各样的参数,不合
: 适的参数结果就是垃圾

avatar
s*2
35
谢谢ttd,说了我想说的话,呵呵。

【在 t*d 的大作中提到】
: 请推荐几个吧。谢谢!
avatar
s*2
36
其实说实话,大家不要笑话我,我都没接触过linux系统呢,所以感觉自己特别失败。

【在 e*****t 的大作中提到】
: 这个在linux下几个简单命令就能解决。
:
: 1,2,..

avatar
A*n
37
这个并不难啊,samtools上去+sed就可以了
确实只是几个命令的事,不过楼主最麻烦的是连自己的机器都没有
别人如果要分析的话,数据传输就得一两天时间。

【在 o********r 的大作中提到】
: 你可以试试(BAM是binary file)。
avatar
L*a
38
这个不算推荐。只是我知道的。
http://www.miningene.com/index.html

【在 s********2 的大作中提到】
: 谢谢ttd,说了我想说的话,呵呵。
avatar
A*n
39
blat可以直接下载他们已经编译好的程序,那个最省事。
不过你要是指望用blat作对,那就得且等着了。

【在 a***e 的大作中提到】
: 我现在在 ubuntu 和 cygwin 下编译 blat 都通不过, 还每搞定。
avatar
A*n
40
这个建议最靠谱了。

【在 e*****t 的大作中提到】
: i could help you do the analysis. co-first author. deal or not deal?
avatar
o*r
41
麻烦不少,每次重做BAM后又得重新sort/index。小的bam可能没啥,100+G的BAM这一步
重做可能就是1个工作日的时间。另外难的是知道为啥程序崩溃,多数软件不会有这么
详细的说明,很多时候需要很长时间的debug才能查到问题是format不对。

【在 A*****n 的大作中提到】
: 这个并不难啊,samtools上去+sed就可以了
: 确实只是几个命令的事,不过楼主最麻烦的是连自己的机器都没有
: 别人如果要分析的话,数据传输就得一两天时间。

avatar
A*n
42
-u + 管道还是能省不少IO上的时间的。楼主总共也才200M reads。最后得到的BAM应该
也就在2,30G这个数量级,不会有特别大的麻烦。
顺便问一下,哪些软件这么bt,下次遇到的时候好注意一下。

【在 o********r 的大作中提到】
: 麻烦不少,每次重做BAM后又得重新sort/index。小的bam可能没啥,100+G的BAM这一步
: 重做可能就是1个工作日的时间。另外难的是知道为啥程序崩溃,多数软件不会有这么
: 详细的说明,很多时候需要很长时间的debug才能查到问题是format不对。

avatar
o*r
43
给你个我遇到过的变态软件:cnver,这家伙用的BAM居然不是coordinates sorted。至
于chr以及排序不同的就太多了,俺遇到过的软件两种格式基本是一半一半

【在 A*****n 的大作中提到】
: -u + 管道还是能省不少IO上的时间的。楼主总共也才200M reads。最后得到的BAM应该
: 也就在2,30G这个数量级,不会有特别大的麻烦。
: 顺便问一下,哪些软件这么bt,下次遇到的时候好注意一下。

avatar
A*n
44
看了一下这个东西的readme文件,他要求的BAM格式确实比较怪异,还不如直接用text
format。你不会是试了那十几个作CNV和SV的软件,然后每次改BAM文件吧?

【在 o********r 的大作中提到】
: 给你个我遇到过的变态软件:cnver,这家伙用的BAM居然不是coordinates sorted。至
: 于chr以及排序不同的就太多了,俺遇到过的软件两种格式基本是一半一半

avatar
y*8
45
自己撺个12-core, 96G memory, 4TB硬盘的workstation,装illumina自己的Cassava,
免费的。
avatar
o*r
46
差不多,还有个比较古怪的FREEC,居然不支持BAM,每次100G的BAM变成pileup格式就
成了300G,然后它再生成个自己的输入格式,又是一个不小的文件,这些IO很是头疼

text

【在 A*****n 的大作中提到】
: 看了一下这个东西的readme文件,他要求的BAM格式确实比较怪异,还不如直接用text
: format。你不会是试了那十几个作CNV和SV的软件,然后每次改BAM文件吧?

avatar
t*d
47
谢谢!
这个好像和 BGI 有关系吧。在 BGI 的老巢,顺义。

【在 L*******a 的大作中提到】
: 这个不算推荐。只是我知道的。
: http://www.miningene.com/index.html

avatar
t*d
48
:)不谢。
BTW,如果你在 Boston 的话,也许我可以帮上一点点忙,把我的机器借给你用。

【在 s********2 的大作中提到】
: 谢谢ttd,说了我想说的话,呵呵。
avatar
s*2
49
谢谢!可惜俺不在啊!真是痛苦!

【在 t*d 的大作中提到】
: :)不谢。
: BTW,如果你在 Boston 的话,也许我可以帮上一点点忙,把我的机器借给你用。

avatar
L*a
50
是从BGI早年在北京的生物信息部门离开的一个人自己搞的公司。后来据说又陆续有其
他人加入。
跟BGI没有关系。

【在 t*d 的大作中提到】
: 谢谢!
: 这个好像和 BGI 有关系吧。在 BGI 的老巢,顺义。

avatar
l*a
51
不太明白你说的unique的序列指什么。我们实验室主要就是做human exome target resequencing。软件分析用的是NextGENe里的sequence aligment然后找mutation SNP。我们没试过barcode的sample,不过软件里有这个功能。如果你能把你的data传过来,我可以给你试试,但不知道你具体想要找什么。

【在 s********2 的大作中提到】
: 谢谢! 我用illumina测序,每个lane里面有好几个个体,个体都加了barcode,我就是
: 想把这些序列根据barcode分配到不同的个体,然后再将每个个体的序列alignment,看
: 看有多少个unique的序列,然后再找SNP。目标挺简单的,还有现成的软件。但是现在
: 限制我的就是服务器的问题。头都大了。

avatar
f*9
52
请问你这个要分析什么结果呢? 做基因组还是转路子,什么应用呢? 可不可以介绍一
下你实验设计的经验?谢谢
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。