Redian新闻
>
求问蛋白质组学proteomics找工作的问题
avatar
求问蛋白质组学proteomics找工作的问题# Biology - 生物学
s*5
1
大家好,我博士四年级。做的方向主要是基于LC-MS的proteomics分析,主要负责整个
课题设计,样品处理,数据分析以及给出一些biological story等等。仪器分析这块是
高度固定化的方法,所以这块背景并不是很强。 不想之后再做学术了,想去industry
找工作,但是因为不清楚proteomics这个方向的就业形势到底是怎么样的,job market
是扩大还是缩小。所以发帖来问问,希望有相关领域的前辈能多多指教,万分感谢。
实验室还有一个方向是mAb定量,以及一些蛋白的定向的绝对定量,似乎在工业界更好
找到工作,不知道是不是这样。如果是的话,也在考虑是不是做这个方向。
avatar
W*o
2
要是放在10年前,proteomics这方向还是很容易找工作的,现在就不好说了;
avatar
v*m
3
质谱方向不错,好好找,可以从小公司做起。

industry
market

【在 s*****5 的大作中提到】
: 大家好,我博士四年级。做的方向主要是基于LC-MS的proteomics分析,主要负责整个
: 课题设计,样品处理,数据分析以及给出一些biological story等等。仪器分析这块是
: 高度固定化的方法,所以这块背景并不是很强。 不想之后再做学术了,想去industry
: 找工作,但是因为不清楚proteomics这个方向的就业形势到底是怎么样的,job market
: 是扩大还是缩小。所以发帖来问问,希望有相关领域的前辈能多多指教,万分感谢。
: 实验室还有一个方向是mAb定量,以及一些蛋白的定向的绝对定量,似乎在工业界更好
: 找到工作,不知道是不是这样。如果是的话,也在考虑是不是做这个方向。

avatar
s*5
4
谢谢您的回复,能再具体说说吗?
是不是最好先做个实习之类的?十分感谢。

【在 v**********m 的大作中提到】
: 质谱方向不错,好好找,可以从小公司做起。
:
: industry
: market

avatar
K*S
5
尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
日常维护什么的也挺重要的.

industry
market

【在 s*****5 的大作中提到】
: 大家好,我博士四年级。做的方向主要是基于LC-MS的proteomics分析,主要负责整个
: 课题设计,样品处理,数据分析以及给出一些biological story等等。仪器分析这块是
: 高度固定化的方法,所以这块背景并不是很强。 不想之后再做学术了,想去industry
: 找工作,但是因为不清楚proteomics这个方向的就业形势到底是怎么样的,job market
: 是扩大还是缩小。所以发帖来问问,希望有相关领域的前辈能多多指教,万分感谢。
: 实验室还有一个方向是mAb定量,以及一些蛋白的定向的绝对定量,似乎在工业界更好
: 找到工作,不知道是不是这样。如果是的话,也在考虑是不是做这个方向。

avatar
f*K
6
大家觉得PTMs方向前景如何?以及不同PTMs的cross-talk。
十分同意这句话,
尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
日常维护什么的也挺重要的.
avatar
s*5
7
你好。我现在不负责仪器的维护和校正,因为lab有专门的人在做,老板觉得这样管理
比较reproducible. 而且我们的方法比较固定化,不做太多LC-MS方面方法的
development。我其实有相当一部分工作都是做high dimensional data的analysis,以
及后面的clustering之类的,我这种奇葩背景是不是很难找到工作呢? lab有另一部分
工作做SRM/MRM定量的,是不是转到那个方面比较好呢?
re. PTM的问题,一点浅见:感觉很热门,但是PTM的很多文章都比较少有特别solid的
结论,characterize的居多吧。之前thermo的一个proteomics group的scientist说,
protein abundance都被研究烂了,key solution一定在PTM上,所以thermo投了很多钱
研究糖基化等修饰的新方法,所以也许是个新的趋势吧

【在 f*******K 的大作中提到】
: 大家觉得PTMs方向前景如何?以及不同PTMs的cross-talk。
: 十分同意这句话,
: 尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
: 日常维护什么的也挺重要的.

avatar
K*S
8
你分析数据是自己写algorithms 还是用现成的?
SRM还是定量的golden standard无论在工业界还是在clinic里面。能学最好学学。

【在 s*****5 的大作中提到】
: 你好。我现在不负责仪器的维护和校正,因为lab有专门的人在做,老板觉得这样管理
: 比较reproducible. 而且我们的方法比较固定化,不做太多LC-MS方面方法的
: development。我其实有相当一部分工作都是做high dimensional data的analysis,以
: 及后面的clustering之类的,我这种奇葩背景是不是很难找到工作呢? lab有另一部分
: 工作做SRM/MRM定量的,是不是转到那个方面比较好呢?
: re. PTM的问题,一点浅见:感觉很热门,但是PTM的很多文章都比较少有特别solid的
: 结论,characterize的居多吧。之前thermo的一个proteomics group的scientist说,
: protein abundance都被研究烂了,key solution一定在PTM上,所以thermo投了很多钱
: 研究糖基化等修饰的新方法,所以也许是个新的趋势吧

avatar
f*K
9
你们分析数据用什么软件呢,我们有的就直接用proteomeDiscover的结果,也有的用自
己写的R算法
avatar
v*m
10
有任何机会参与工业界都不要错过,即使是小项目或小公司。你会在那些公司学到学校
永远也学不到的项目和业界标准。

【在 s*****5 的大作中提到】
: 谢谢您的回复,能再具体说说吗?
: 是不是最好先做个实习之类的?十分感谢。

avatar
s*5
11
是用R写一些小的algorithm,以及各种包的接口。大部分工作是,比较各种现成的各种
algorithm,database search,FDR control,alignment,quantification等等,找出对
我们lab最优化的再把他们接在一起,这样。自己和统计系的collaborator合作develop
过一个proteomics data analysis的R包。
嗯,谢谢您的建议,打算找机会做个SRM的课题。

【在 K******S 的大作中提到】
: 你分析数据是自己写algorithms 还是用现成的?
: SRM还是定量的golden standard无论在工业界还是在clinic里面。能学最好学学。

avatar
s*5
12
你好,我们之前用过PD,但是我发现sequest和mascot搜到的蛋白太少,我个人觉得
MSGF+好些。对啦,用PD的话你们用percolator吗?感觉那个得到的蛋白很多,但是PD
导出的结果没办法卡proein FDR.分析数据我们也是用R写算法。有机会可以交流交流~

【在 f*******K 的大作中提到】
: 你们分析数据用什么软件呢,我们有的就直接用proteomeDiscover的结果,也有的用自
: 己写的R算法

avatar
k*o
13
工业界还是少。cross-talk更是太学术界的概念。工业界都是具体case具体分析。找
PTM当然也找,但大都是characterize具体的therapeutic protein的PTM(包括环境导
致的各种modification),看影不影响Protein药物的efficacy。Drug discovery阶段
可能会有些大规模的筛选,但貌似用MS做discovery在工业界还是太超前了。好像有少
量职位是偏研究型discovery的。
SRM确实是用的多。所以Triple quadruple永远不会退出舞台。

【在 f*******K 的大作中提到】
: 大家觉得PTMs方向前景如何?以及不同PTMs的cross-talk。
: 十分同意这句话,
: 尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
: 日常维护什么的也挺重要的.

avatar
s*s
14
确实要做定量
机器要熟悉 当然大部分时候都是公司的人过来做PM,但是面试的时候肯定会问到
TroubleShooting方面的问题 那时候你不可能说 都是公司的人做的
可以试着各种仪器都可以了解下 因为都差不多嘛
我以前在Proteomic Facility做所以各种仪器都见过些 但是公司招人的时候有时候会
特别偏向用某一种/某类型的 那时候你有过那一个仪器的经验就很重要
avatar
f*K
15
TO shxm725, PD 里面有percolator node啊,percolator就可以控制FDR,mascot
SEQUEST的数据质量还不错,我们一直用这两个search. proteomics data analysis的R
包用于什么目的?,我很感兴趣。
avatar
s*5
16
percolator我有一个问题,就是如何控制protein level的FDR呢?PD是自己search了
decoy database,但是decoy spectra输出都没有,没法从结果直接控制protein FDR。
还有就是我比较过mascot+percolator和MSGF+的结果,用一个spike in的sample(就是
知道真值的),percolator的结果不太可靠。不知道你们是不是有相关的测试呢?可以
交流交流。我觉得identification非常重要,但是都没有一个统一去control和
evaluate的标准。
R包干的事情说起来有点长,简单来讲就是把peak AUC的data 和quantifiable
spectrum associate起来,然后再normalization, clean-up, aggregtation等等。。。

的R

【在 f*******K 的大作中提到】
: TO shxm725, PD 里面有percolator node啊,percolator就可以控制FDR,mascot
: SEQUEST的数据质量还不错,我们一直用这两个search. proteomics data analysis的R
: 包用于什么目的?,我很感兴趣。

avatar
s*5
17
嗯,谢谢建议。我目前只熟悉orbitrap,实验室还有Triple Quad,但是没用过,得开始
学习了。。。

【在 s******s 的大作中提到】
: 确实要做定量
: 机器要熟悉 当然大部分时候都是公司的人过来做PM,但是面试的时候肯定会问到
: TroubleShooting方面的问题 那时候你不可能说 都是公司的人做的
: 可以试着各种仪器都可以了解下 因为都差不多嘛
: 我以前在Proteomic Facility做所以各种仪器都见过些 但是公司招人的时候有时候会
: 特别偏向用某一种/某类型的 那时候你有过那一个仪器的经验就很重要

avatar
K*S
18
我个人越来越觉得FDR没太大用处了,现在的仪器都是HR/AM,测量精确度一般都是1,2
个ppm以内的偏差,ID的FDR是2%或者5%会对结果有很大的区别?
而且ID后面还有好多事情要做,biologist也不care,只要他们能用生化或者细胞试验验
证,mass spectromist也不care,因为我们会inspect raw spectra,真正重要的东西会
合成peptide来验证。

。。

【在 s*****5 的大作中提到】
: percolator我有一个问题,就是如何控制protein level的FDR呢?PD是自己search了
: decoy database,但是decoy spectra输出都没有,没法从结果直接控制protein FDR。
: 还有就是我比较过mascot+percolator和MSGF+的结果,用一个spike in的sample(就是
: 知道真值的),percolator的结果不太可靠。不知道你们是不是有相关的测试呢?可以
: 交流交流。我觉得identification非常重要,但是都没有一个统一去control和
: evaluate的标准。
: R包干的事情说起来有点长,简单来讲就是把peak AUC的data 和quantifiable
: spectrum associate起来,然后再normalization, clean-up, aggregtation等等。。。
:
: 的R

avatar
s*5
19
测量精确到1,2ppm?这个是啥仪器?我们orbitrap搜库mass tolerance 20ppm,如果用
10ppm的话spectra就会少很多,从分布上来看median也要5ppm呢。
真正重要的东西的确biologist和做MS的不care,做MRM做targeted 验证才是王道。
但是2%和5%对precision/accuracy真的有很明显的影响。。。至少我做出的结果是这样
。。。所以我觉得publication的严谨性是个问题吧。很多paper都号称找到5000+的蛋
白,但是到底是怎么样得到的,是不是严谨,这可能会造成误导吧。不过可能我的思维
还是太钻牛角尖了

,2

【在 K******S 的大作中提到】
: 我个人越来越觉得FDR没太大用处了,现在的仪器都是HR/AM,测量精确度一般都是1,2
: 个ppm以内的偏差,ID的FDR是2%或者5%会对结果有很大的区别?
: 而且ID后面还有好多事情要做,biologist也不care,只要他们能用生化或者细胞试验验
: 证,mass spectromist也不care,因为我们会inspect raw spectra,真正重要的东西会
: 合成peptide来验证。
:
: 。。

avatar
K*S
20
orbitrap calibrate好了,加上LOCK MASS,
有的组喜欢做score board的东西,象你说的5000个蛋白这种。2%和5%的区别是什么?
少找了200个蛋白对整个试验不会有影响的,全是的有后续的验证,或者生物学上的意
义。现在这种work flow已经很成熟了,是个LAB就可以作出来。
FDR怎么会对定量的precision/accuracy有影响呢,试验的设计和用的方法更重要。这
行里有句话是“JUNK IN, JUNK OUT",反过来说就是类似真金不怕火炼,真正的东西最
后无论你如何分析数据都会显露出来,那些在FRINGE附近的东西反正也是摸能两可的,
要不丢掉,要不就合成标准品验证。
还是那句话,如果后续试验可以验证你的结论,或者支持你结论的MS/MS没问题,没有
必要纠结整个data set的FDR是2%还是5%.

【在 s*****5 的大作中提到】
: 测量精确到1,2ppm?这个是啥仪器?我们orbitrap搜库mass tolerance 20ppm,如果用
: 10ppm的话spectra就会少很多,从分布上来看median也要5ppm呢。
: 真正重要的东西的确biologist和做MS的不care,做MRM做targeted 验证才是王道。
: 但是2%和5%对precision/accuracy真的有很明显的影响。。。至少我做出的结果是这样
: 。。。所以我觉得publication的严谨性是个问题吧。很多paper都号称找到5000+的蛋
: 白,但是到底是怎么样得到的,是不是严谨,这可能会造成误导吧。不过可能我的思维
: 还是太钻牛角尖了
:
: ,2

avatar
s*5
21
前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
一般会被排除。
但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
品里,那么这个population的precision可以用coefficient of variation from
median来表示,accuracy用deviation of median from true ratio来表示的话, 这些
低质量的PSM肯定会导致整体数据quality下降。这可能也是为什么很多journal都要求
文章里的数据protein FDR<1%。
BTW,你说的lock mass指的是mann group 发表的“Parts per Million Mass Accuracy
on an
Orbitrap Mass Spectrometer via Lock Mass Injection into a C-trap”?
这个我们试过,发现不是每个scan都有那个background ion,这可能是什么问题呢?是
否能指点一二?十分感谢!

【在 K******S 的大作中提到】
: orbitrap calibrate好了,加上LOCK MASS,
: 有的组喜欢做score board的东西,象你说的5000个蛋白这种。2%和5%的区别是什么?
: 少找了200个蛋白对整个试验不会有影响的,全是的有后续的验证,或者生物学上的意
: 义。现在这种work flow已经很成熟了,是个LAB就可以作出来。
: FDR怎么会对定量的precision/accuracy有影响呢,试验的设计和用的方法更重要。这
: 行里有句话是“JUNK IN, JUNK OUT",反过来说就是类似真金不怕火炼,真正的东西最
: 后无论你如何分析数据都会显露出来,那些在FRINGE附近的东西反正也是摸能两可的,
: 要不丢掉,要不就合成标准品验证。
: 还是那句话,如果后续试验可以验证你的结论,或者支持你结论的MS/MS没问题,没有
: 必要纠结整个data set的FDR是2%还是5%.

avatar
s*a
22
We just installed a QE HF.
mass precision < 3 ppm in most cases if calibration is done regularly.
avatar
K*S
23
let me put it this way
1st experiment, total ID 5,000, FDR 50% but I got all my lead peptides
verified with either standard peptides or biochemistry/cell biology
experiments. total number of lead peptides ~20
2nd experiment, total ID 5,000 FDR 1% but there's no follow up validation on
lead peptides, total number of lead peptides ~ 200.
If you are about to develop expensive antibody or other assays to translate
the findings into clinic, which experiments you prefer to trust more? You
see my points here?
As to background lock mass, it's different in each lab environment.

.

【在 s*****5 的大作中提到】
: 前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
: 到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
: 一般会被排除。
: 但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
: 的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
: 3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
: 包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
: 低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
: 品里,那么这个population的precision可以用coefficient of variation from
: median来表示,accuracy用deviation of median from true ratio来表示的话, 这些

avatar
l*y
24
Proteomics 里的FDR是个很不靠谱的概念,特别是decoy的方法。好好做好上游的
preparation 和下游的follow up才更有意思。

.
★ 发自iPhone App: ChineseWeb 1.0.1

【在 s*****5 的大作中提到】
: 前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
: 到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
: 一般会被排除。
: 但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
: 的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
: 3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
: 包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
: 低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
: 品里,那么这个population的precision可以用coefficient of variation from
: median来表示,accuracy用deviation of median from true ratio来表示的话, 这些

avatar
s*5
25
您的point主要就是只有validate过的data是可信的,其他的都没什么用。
我知道了。谢谢。

on
translate

【在 K******S 的大作中提到】
: let me put it this way
: 1st experiment, total ID 5,000, FDR 50% but I got all my lead peptides
: verified with either standard peptides or biochemistry/cell biology
: experiments. total number of lead peptides ~20
: 2nd experiment, total ID 5,000 FDR 1% but there's no follow up validation on
: lead peptides, total number of lead peptides ~ 200.
: If you are about to develop expensive antibody or other assays to translate
: the findings into clinic, which experiments you prefer to trust more? You
: see my points here?
: As to background lock mass, it's different in each lab environment.

avatar
s*5
26
大家好,我博士四年级。做的方向主要是基于LC-MS的proteomics分析,主要负责整个
课题设计,样品处理,数据分析以及给出一些biological story等等。仪器分析这块是
高度固定化的方法,所以这块背景并不是很强。 不想之后再做学术了,想去industry
找工作,但是因为不清楚proteomics这个方向的就业形势到底是怎么样的,job market
是扩大还是缩小。所以发帖来问问,希望有相关领域的前辈能多多指教,万分感谢。
实验室还有一个方向是mAb定量,以及一些蛋白的定向的绝对定量,似乎在工业界更好
找到工作,不知道是不是这样。如果是的话,也在考虑是不是做这个方向。
avatar
W*o
27
要是放在10年前,proteomics这方向还是很容易找工作的,现在就不好说了;
avatar
v*m
28
质谱方向不错,好好找,可以从小公司做起。

industry
market

【在 s*****5 的大作中提到】
: 大家好,我博士四年级。做的方向主要是基于LC-MS的proteomics分析,主要负责整个
: 课题设计,样品处理,数据分析以及给出一些biological story等等。仪器分析这块是
: 高度固定化的方法,所以这块背景并不是很强。 不想之后再做学术了,想去industry
: 找工作,但是因为不清楚proteomics这个方向的就业形势到底是怎么样的,job market
: 是扩大还是缩小。所以发帖来问问,希望有相关领域的前辈能多多指教,万分感谢。
: 实验室还有一个方向是mAb定量,以及一些蛋白的定向的绝对定量,似乎在工业界更好
: 找到工作,不知道是不是这样。如果是的话,也在考虑是不是做这个方向。

avatar
s*5
29
谢谢您的回复,能再具体说说吗?
是不是最好先做个实习之类的?十分感谢。

【在 v**********m 的大作中提到】
: 质谱方向不错,好好找,可以从小公司做起。
:
: industry
: market

avatar
K*S
30
尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
日常维护什么的也挺重要的.

industry
market

【在 s*****5 的大作中提到】
: 大家好,我博士四年级。做的方向主要是基于LC-MS的proteomics分析,主要负责整个
: 课题设计,样品处理,数据分析以及给出一些biological story等等。仪器分析这块是
: 高度固定化的方法,所以这块背景并不是很强。 不想之后再做学术了,想去industry
: 找工作,但是因为不清楚proteomics这个方向的就业形势到底是怎么样的,job market
: 是扩大还是缩小。所以发帖来问问,希望有相关领域的前辈能多多指教,万分感谢。
: 实验室还有一个方向是mAb定量,以及一些蛋白的定向的绝对定量,似乎在工业界更好
: 找到工作,不知道是不是这样。如果是的话,也在考虑是不是做这个方向。

avatar
f*K
31
大家觉得PTMs方向前景如何?以及不同PTMs的cross-talk。
十分同意这句话,
尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
日常维护什么的也挺重要的.
avatar
s*5
32
你好。我现在不负责仪器的维护和校正,因为lab有专门的人在做,老板觉得这样管理
比较reproducible. 而且我们的方法比较固定化,不做太多LC-MS方面方法的
development。我其实有相当一部分工作都是做high dimensional data的analysis,以
及后面的clustering之类的,我这种奇葩背景是不是很难找到工作呢? lab有另一部分
工作做SRM/MRM定量的,是不是转到那个方面比较好呢?
re. PTM的问题,一点浅见:感觉很热门,但是PTM的很多文章都比较少有特别solid的
结论,characterize的居多吧。之前thermo的一个proteomics group的scientist说,
protein abundance都被研究烂了,key solution一定在PTM上,所以thermo投了很多钱
研究糖基化等修饰的新方法,所以也许是个新的趋势吧

【在 f*******K 的大作中提到】
: 大家觉得PTMs方向前景如何?以及不同PTMs的cross-talk。
: 十分同意这句话,
: 尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
: 日常维护什么的也挺重要的.

avatar
K*S
33
你分析数据是自己写algorithms 还是用现成的?
SRM还是定量的golden standard无论在工业界还是在clinic里面。能学最好学学。

【在 s*****5 的大作中提到】
: 你好。我现在不负责仪器的维护和校正,因为lab有专门的人在做,老板觉得这样管理
: 比较reproducible. 而且我们的方法比较固定化,不做太多LC-MS方面方法的
: development。我其实有相当一部分工作都是做high dimensional data的analysis,以
: 及后面的clustering之类的,我这种奇葩背景是不是很难找到工作呢? lab有另一部分
: 工作做SRM/MRM定量的,是不是转到那个方面比较好呢?
: re. PTM的问题,一点浅见:感觉很热门,但是PTM的很多文章都比较少有特别solid的
: 结论,characterize的居多吧。之前thermo的一个proteomics group的scientist说,
: protein abundance都被研究烂了,key solution一定在PTM上,所以thermo投了很多钱
: 研究糖基化等修饰的新方法,所以也许是个新的趋势吧

avatar
f*K
34
你们分析数据用什么软件呢,我们有的就直接用proteomeDiscover的结果,也有的用自
己写的R算法
avatar
v*m
35
有任何机会参与工业界都不要错过,即使是小项目或小公司。你会在那些公司学到学校
永远也学不到的项目和业界标准。

【在 s*****5 的大作中提到】
: 谢谢您的回复,能再具体说说吗?
: 是不是最好先做个实习之类的?十分感谢。

avatar
s*5
36
是用R写一些小的algorithm,以及各种包的接口。大部分工作是,比较各种现成的各种
algorithm,database search,FDR control,alignment,quantification等等,找出对
我们lab最优化的再把他们接在一起,这样。自己和统计系的collaborator合作develop
过一个proteomics data analysis的R包。
嗯,谢谢您的建议,打算找机会做个SRM的课题。

【在 K******S 的大作中提到】
: 你分析数据是自己写algorithms 还是用现成的?
: SRM还是定量的golden standard无论在工业界还是在clinic里面。能学最好学学。

avatar
s*5
37
你好,我们之前用过PD,但是我发现sequest和mascot搜到的蛋白太少,我个人觉得
MSGF+好些。对啦,用PD的话你们用percolator吗?感觉那个得到的蛋白很多,但是PD
导出的结果没办法卡proein FDR.分析数据我们也是用R写算法。有机会可以交流交流~

【在 f*******K 的大作中提到】
: 你们分析数据用什么软件呢,我们有的就直接用proteomeDiscover的结果,也有的用自
: 己写的R算法

avatar
k*o
38
工业界还是少。cross-talk更是太学术界的概念。工业界都是具体case具体分析。找
PTM当然也找,但大都是characterize具体的therapeutic protein的PTM(包括环境导
致的各种modification),看影不影响Protein药物的efficacy。Drug discovery阶段
可能会有些大规模的筛选,但貌似用MS做discovery在工业界还是太超前了。好像有少
量职位是偏研究型discovery的。
SRM确实是用的多。所以Triple quadruple永远不会退出舞台。

【在 f*******K 的大作中提到】
: 大家觉得PTMs方向前景如何?以及不同PTMs的cross-talk。
: 十分同意这句话,
: 尽量多做定量,SRM/MRM,PRM,HRAM什么的,DISCOVERY的LC-MS/MS次要.另外要多摸仪器,
: 日常维护什么的也挺重要的.

avatar
s*s
39
确实要做定量
机器要熟悉 当然大部分时候都是公司的人过来做PM,但是面试的时候肯定会问到
TroubleShooting方面的问题 那时候你不可能说 都是公司的人做的
可以试着各种仪器都可以了解下 因为都差不多嘛
我以前在Proteomic Facility做所以各种仪器都见过些 但是公司招人的时候有时候会
特别偏向用某一种/某类型的 那时候你有过那一个仪器的经验就很重要
avatar
f*K
40
TO shxm725, PD 里面有percolator node啊,percolator就可以控制FDR,mascot
SEQUEST的数据质量还不错,我们一直用这两个search. proteomics data analysis的R
包用于什么目的?,我很感兴趣。
avatar
s*5
41
percolator我有一个问题,就是如何控制protein level的FDR呢?PD是自己search了
decoy database,但是decoy spectra输出都没有,没法从结果直接控制protein FDR。
还有就是我比较过mascot+percolator和MSGF+的结果,用一个spike in的sample(就是
知道真值的),percolator的结果不太可靠。不知道你们是不是有相关的测试呢?可以
交流交流。我觉得identification非常重要,但是都没有一个统一去control和
evaluate的标准。
R包干的事情说起来有点长,简单来讲就是把peak AUC的data 和quantifiable
spectrum associate起来,然后再normalization, clean-up, aggregtation等等。。。

的R

【在 f*******K 的大作中提到】
: TO shxm725, PD 里面有percolator node啊,percolator就可以控制FDR,mascot
: SEQUEST的数据质量还不错,我们一直用这两个search. proteomics data analysis的R
: 包用于什么目的?,我很感兴趣。

avatar
s*5
42
嗯,谢谢建议。我目前只熟悉orbitrap,实验室还有Triple Quad,但是没用过,得开始
学习了。。。

【在 s******s 的大作中提到】
: 确实要做定量
: 机器要熟悉 当然大部分时候都是公司的人过来做PM,但是面试的时候肯定会问到
: TroubleShooting方面的问题 那时候你不可能说 都是公司的人做的
: 可以试着各种仪器都可以了解下 因为都差不多嘛
: 我以前在Proteomic Facility做所以各种仪器都见过些 但是公司招人的时候有时候会
: 特别偏向用某一种/某类型的 那时候你有过那一个仪器的经验就很重要

avatar
K*S
43
我个人越来越觉得FDR没太大用处了,现在的仪器都是HR/AM,测量精确度一般都是1,2
个ppm以内的偏差,ID的FDR是2%或者5%会对结果有很大的区别?
而且ID后面还有好多事情要做,biologist也不care,只要他们能用生化或者细胞试验验
证,mass spectromist也不care,因为我们会inspect raw spectra,真正重要的东西会
合成peptide来验证。

。。

【在 s*****5 的大作中提到】
: percolator我有一个问题,就是如何控制protein level的FDR呢?PD是自己search了
: decoy database,但是decoy spectra输出都没有,没法从结果直接控制protein FDR。
: 还有就是我比较过mascot+percolator和MSGF+的结果,用一个spike in的sample(就是
: 知道真值的),percolator的结果不太可靠。不知道你们是不是有相关的测试呢?可以
: 交流交流。我觉得identification非常重要,但是都没有一个统一去control和
: evaluate的标准。
: R包干的事情说起来有点长,简单来讲就是把peak AUC的data 和quantifiable
: spectrum associate起来,然后再normalization, clean-up, aggregtation等等。。。
:
: 的R

avatar
s*5
44
测量精确到1,2ppm?这个是啥仪器?我们orbitrap搜库mass tolerance 20ppm,如果用
10ppm的话spectra就会少很多,从分布上来看median也要5ppm呢。
真正重要的东西的确biologist和做MS的不care,做MRM做targeted 验证才是王道。
但是2%和5%对precision/accuracy真的有很明显的影响。。。至少我做出的结果是这样
。。。所以我觉得publication的严谨性是个问题吧。很多paper都号称找到5000+的蛋
白,但是到底是怎么样得到的,是不是严谨,这可能会造成误导吧。不过可能我的思维
还是太钻牛角尖了

,2

【在 K******S 的大作中提到】
: 我个人越来越觉得FDR没太大用处了,现在的仪器都是HR/AM,测量精确度一般都是1,2
: 个ppm以内的偏差,ID的FDR是2%或者5%会对结果有很大的区别?
: 而且ID后面还有好多事情要做,biologist也不care,只要他们能用生化或者细胞试验验
: 证,mass spectromist也不care,因为我们会inspect raw spectra,真正重要的东西会
: 合成peptide来验证。
:
: 。。

avatar
K*S
45
orbitrap calibrate好了,加上LOCK MASS,
有的组喜欢做score board的东西,象你说的5000个蛋白这种。2%和5%的区别是什么?
少找了200个蛋白对整个试验不会有影响的,全是的有后续的验证,或者生物学上的意
义。现在这种work flow已经很成熟了,是个LAB就可以作出来。
FDR怎么会对定量的precision/accuracy有影响呢,试验的设计和用的方法更重要。这
行里有句话是“JUNK IN, JUNK OUT",反过来说就是类似真金不怕火炼,真正的东西最
后无论你如何分析数据都会显露出来,那些在FRINGE附近的东西反正也是摸能两可的,
要不丢掉,要不就合成标准品验证。
还是那句话,如果后续试验可以验证你的结论,或者支持你结论的MS/MS没问题,没有
必要纠结整个data set的FDR是2%还是5%.

【在 s*****5 的大作中提到】
: 测量精确到1,2ppm?这个是啥仪器?我们orbitrap搜库mass tolerance 20ppm,如果用
: 10ppm的话spectra就会少很多,从分布上来看median也要5ppm呢。
: 真正重要的东西的确biologist和做MS的不care,做MRM做targeted 验证才是王道。
: 但是2%和5%对precision/accuracy真的有很明显的影响。。。至少我做出的结果是这样
: 。。。所以我觉得publication的严谨性是个问题吧。很多paper都号称找到5000+的蛋
: 白,但是到底是怎么样得到的,是不是严谨,这可能会造成误导吧。不过可能我的思维
: 还是太钻牛角尖了
:
: ,2

avatar
s*5
46
前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
一般会被排除。
但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
品里,那么这个population的precision可以用coefficient of variation from
median来表示,accuracy用deviation of median from true ratio来表示的话, 这些
低质量的PSM肯定会导致整体数据quality下降。这可能也是为什么很多journal都要求
文章里的数据protein FDR<1%。
BTW,你说的lock mass指的是mann group 发表的“Parts per Million Mass Accuracy
on an
Orbitrap Mass Spectrometer via Lock Mass Injection into a C-trap”?
这个我们试过,发现不是每个scan都有那个background ion,这可能是什么问题呢?是
否能指点一二?十分感谢!

【在 K******S 的大作中提到】
: orbitrap calibrate好了,加上LOCK MASS,
: 有的组喜欢做score board的东西,象你说的5000个蛋白这种。2%和5%的区别是什么?
: 少找了200个蛋白对整个试验不会有影响的,全是的有后续的验证,或者生物学上的意
: 义。现在这种work flow已经很成熟了,是个LAB就可以作出来。
: FDR怎么会对定量的precision/accuracy有影响呢,试验的设计和用的方法更重要。这
: 行里有句话是“JUNK IN, JUNK OUT",反过来说就是类似真金不怕火炼,真正的东西最
: 后无论你如何分析数据都会显露出来,那些在FRINGE附近的东西反正也是摸能两可的,
: 要不丢掉,要不就合成标准品验证。
: 还是那句话,如果后续试验可以验证你的结论,或者支持你结论的MS/MS没问题,没有
: 必要纠结整个data set的FDR是2%还是5%.

avatar
s*a
47
We just installed a QE HF.
mass precision < 3 ppm in most cases if calibration is done regularly.
avatar
K*S
48
let me put it this way
1st experiment, total ID 5,000, FDR 50% but I got all my lead peptides
verified with either standard peptides or biochemistry/cell biology
experiments. total number of lead peptides ~20
2nd experiment, total ID 5,000 FDR 1% but there's no follow up validation on
lead peptides, total number of lead peptides ~ 200.
If you are about to develop expensive antibody or other assays to translate
the findings into clinic, which experiments you prefer to trust more? You
see my points here?
As to background lock mass, it's different in each lab environment.

.

【在 s*****5 的大作中提到】
: 前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
: 到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
: 一般会被排除。
: 但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
: 的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
: 3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
: 包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
: 低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
: 品里,那么这个population的precision可以用coefficient of variation from
: median来表示,accuracy用deviation of median from true ratio来表示的话, 这些

avatar
l*y
49
Proteomics 里的FDR是个很不靠谱的概念,特别是decoy的方法。好好做好上游的
preparation 和下游的follow up才更有意思。

.
★ 发自iPhone App: ChineseWeb 1.0.1

【在 s*****5 的大作中提到】
: 前辈说的precison/accuracy指的应该是LC-MS定量方法的吧,FDR不会影响这个,特定
: 到每一个肽或者蛋白也不会有太大影响。而且,不好的spectrum variation都比较大,
: 一般会被排除。
: 但是,我觉得FDR会影响整体数据的precision/accuracy.这升高的3%FDR,意味着整个
: 的score cutoff提高了很多,多的不只是200个蛋白,还有上千的肽和可能上万的PSM.
: 3%的protein FDR的提升几乎等同于多加了>10% 的PSM,假设一个run有8w个spectrum,
: 包含进来的质量不好的PSM可能大几千。我们现在定量是base on Peak AUC, 所以这些
: 低质量的spectrum对整体的定量都会有影响。假设我们spike in了几十个蛋白在背景样
: 品里,那么这个population的precision可以用coefficient of variation from
: median来表示,accuracy用deviation of median from true ratio来表示的话, 这些

avatar
s*5
50
您的point主要就是只有validate过的data是可信的,其他的都没什么用。
我知道了。谢谢。

on
translate

【在 K******S 的大作中提到】
: let me put it this way
: 1st experiment, total ID 5,000, FDR 50% but I got all my lead peptides
: verified with either standard peptides or biochemistry/cell biology
: experiments. total number of lead peptides ~20
: 2nd experiment, total ID 5,000 FDR 1% but there's no follow up validation on
: lead peptides, total number of lead peptides ~ 200.
: If you are about to develop expensive antibody or other assays to translate
: the findings into clinic, which experiments you prefer to trust more? You
: see my points here?
: As to background lock mass, it's different in each lab environment.

avatar
h*s
51
来多说一句,感觉这行已经跟Genomics一样,往bioinformatics发展了。比如学术的话
,基本上都是走大规模的resource方向,各种tissue,cell line一起上,然后弄篇CNS
,说到底还是bioinformatics的数据分析。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。