Redian新闻
>
请教一个统计学问题,需要多少个SNPs去鉴定一个人
avatar
请教一个统计学问题,需要多少个SNPs去鉴定一个人# Biology - 生物学
r*z
1
各位推荐一款出差用的耳机吧,可以听听手机音乐在飞机上用来看看电影的?现在
delta竟然不给免费耳机了
avatar
w*k
2
正在找文献,还没有找到那个统计方法和公式合适(统计水平有限)
大概最简单的应该假定每个SNP都是50-50 heterozygous (AA, Aa, aa)
人类总共有多少SNPs
总共有多少人
或者是forensic里面match database,有多好的 power of discrimination
谢谢
avatar
H*l
3
Bose QC30/QC35
avatar
D*a
4
为什么要用SNPs鉴定而不用STRs
avatar
i*x
5
qc20啊 30是无线蓝牙的 在飞机上有什么用?

【在 H****l 的大作中提到】
: Bose QC30/QC35
avatar
w*k
6
STRs 也行,统计上的方法差不多吧

【在 D*a 的大作中提到】
: 为什么要用SNPs鉴定而不用STRs
avatar
a*a
7

qc20不是无线的。QC35是,但可以用线连。飞机上用的话,避免qc30吧。

【在 i****x 的大作中提到】
: qc20啊 30是无线蓝牙的 在飞机上有什么用?
avatar
D*a
8
STRs的话不就是亲子鉴定了,现在流行的就是十几个位点,就够了,这方面应该有不少
资料看怎么算出来。
如果是单个SNP的话应该每条染色体有ATCG四种选择(理论上),然后人两条染色体就
是4选2=6,单个位点有六种选择,也就是能把全世界人分成6份,两个位点就是6*6,能
把全世界人分成36份,然后就是6的?次方= 70亿
我的思路。

【在 w**k 的大作中提到】
: STRs 也行,统计上的方法差不多吧
avatar
F*Q
9

any earbud headphone should work (you can also buy one on the flight for a
few bucks)

【在 r******z 的大作中提到】
: 各位推荐一款出差用的耳机吧,可以听听手机音乐在飞机上用来看看电影的?现在
: delta竟然不给免费耳机了

avatar
h*n
10
您没做过SNP吧 这理论上有错啊

【在 D*a 的大作中提到】
: STRs的话不就是亲子鉴定了,现在流行的就是十几个位点,就够了,这方面应该有不少
: 资料看怎么算出来。
: 如果是单个SNP的话应该每条染色体有ATCG四种选择(理论上),然后人两条染色体就
: 是4选2=6,单个位点有六种选择,也就是能把全世界人分成6份,两个位点就是6*6,能
: 把全世界人分成36份,然后就是6的?次方= 70亿
: 我的思路。

avatar
s*m
11
一副有线 Sennheiser CX 300 II
一副无线 iDeaUSA Bluetooth Headphones
avatar
D*a
12
是没做过,请问哪里错了?

【在 h**********n 的大作中提到】
: 您没做过SNP吧 这理论上有错啊
avatar
n*u
13
飞机上QC25或者QC35,静下来不听音乐都可以。
或者好一些的入耳耳机(耳塞一样的耳机)也可以,但是必须开着声音。
avatar
w*k
14
如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或
者兄弟姐妹的,或者邻居老王的,甚至不遗传相关的陌生人。我需要设计这么一个SNP
panel,然后我测定X之后,可以在统计学意义上说,样品X和数据库里面的X是同一个人
,其中的错误的可能性小到可以忽略。

【在 D*a 的大作中提到】
: 是没做过,请问哪里错了?
avatar
m*s
15
你这个就是个概率问题了,算清楚概率就行了

如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或
者兄弟姐妹的,或者邻居老王的,甚至不遗传相关的陌生人。我需要设计这么一个SNP
panel,然后我测定X之后,可以在统计学意义上说,样品X和数据库里面的X是同一个人
,其中的错误的可能性小到可以忽略。

【在 w**k 的大作中提到】
: 如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
: 是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
: 具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
: 常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
: 我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
: 库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
: 的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
: 不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或
: 者兄弟姐妹的,或者邻居老王的,甚至不遗传相关的陌生人。我需要设计这么一个SNP
: panel,然后我测定X之后,可以在统计学意义上说,样品X和数据库里面的X是同一个人

avatar
a*k
16
STR的方法简单,成熟。SNP目前还是比较有难度的,不过doable。

【在 w**k 的大作中提到】
: STRs 也行,统计上的方法差不多吧
avatar
w*k
17
问题就是怎么算概率,还有该要多少SNPs

X
SNP

【在 m*****s 的大作中提到】
: 你这个就是个概率问题了,算清楚概率就行了
:
: 如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
: 是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
: 具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
: 常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
: 我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
: 库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
: 的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
: 不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或

avatar
a*k
18
真要做的话不仅仅是概率了,SNP和种族的关系太大,多样性又不如STR。做起来有难度。

X
SNP

【在 m*****s 的大作中提到】
: 你这个就是个概率问题了,算清楚概率就行了
:
: 如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
: 是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
: 具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
: 常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
: 我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
: 库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
: 的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
: 不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或

avatar
D*a
19
哦对,我想错了。
hetero可以再详细分么?比如如果是A/C,按照测序原理会不会看出来是爸爸是A还是妈
妈是A?还是只能看出来是hetero呢?

X
SNP

【在 w**k 的大作中提到】
: 如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
: 是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
: 具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
: 常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
: 我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
: 库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
: 的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
: 不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或
: 者兄弟姐妹的,或者邻居老王的,甚至不遗传相关的陌生人。我需要设计这么一个SNP
: panel,然后我测定X之后,可以在统计学意义上说,样品X和数据库里面的X是同一个人

avatar
w*k
20
AA CC GG TT
AC AG AT CG CT GT
测出来的结果,比如AC,你基本上无法知道A是从父亲那里来的,还是母亲那里来的。

【在 D*a 的大作中提到】
: 哦对,我想错了。
: hetero可以再详细分么?比如如果是A/C,按照测序原理会不会看出来是爸爸是A还是妈
: 妈是A?还是只能看出来是hetero呢?
:
: X
: SNP

avatar
g*a
21
关键是选择哪几个SNP。CNV, rare variant的发生概率不一样,更何况还有linkage
disequilibrium。根本不可能按照随机事件的概率来假设。所以选择SNP很重要。这方
面应该有很多文章讨论的。DNA测试选的那几个SNP都是有原因的。话说,要达到你的目
的,直接选用那些SNP不就可以了吗?
avatar
w*k
22
只能通过选择不同染色体上面,然后尽量远离的SNP来假定没有linkage了
设定了标准,可以从SNP里面去选,但是标准怎么定,然后statistical
discriminatory power怎么算 --- 还没找到合适的paper

【在 g**a 的大作中提到】
: 关键是选择哪几个SNP。CNV, rare variant的发生概率不一样,更何况还有linkage
: disequilibrium。根本不可能按照随机事件的概率来假设。所以选择SNP很重要。这方
: 面应该有很多文章讨论的。DNA测试选的那几个SNP都是有原因的。话说,要达到你的目
: 的,直接选用那些SNP不就可以了吗?

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。