avatar
如何算P value?# Biology - 生物学
n*n
1
公司跟我律师说,这个$320对以前的h1b都是不交的,就是h1b自己交,公司只负责另外
$1500+$500.
可这应该是employer交的,不知道什么法律规定的,但是在I-129的instruction上是这
么写的(见下面链接21页)。
http://www.uscis.gov/files/form/i-129instr.pdf
请问h1b本人交,uscis没问题吧? 谢谢!
avatar
s*y
2
在已经知道两个样品组的平均值,采样量,以及偏差值的情况下,一般的student
distribution如何计算P value?
古狗了几个网站,看的我莫名其妙,只好来问大家了。
avatar
I*a
3
excel 里面套公式
=TTEST
avatar
s*y
4
那个公式好像需要原始数据,但是我从合作者那里拿到的数据是已经算好的平均值,方
差,
以及采样量等信息

【在 I***a 的大作中提到】
: excel 里面套公式
: =TTEST

avatar
I*a
5
前一段时间,我也研究过,
那这样好像是不行,
等高人出现
avatar
n*w
6
google t-test
or find a biostats book.
avatar
n*t
7
把原始数据要来,至少要看一下是否有明显的outlier,以及是否离normal
distribution太远。否则t test可能一点意义没有。

【在 s******y 的大作中提到】
: 那个公式好像需要原始数据,但是我从合作者那里拿到的数据是已经算好的平均值,方
: 差,
: 以及采样量等信息

avatar
s*y
8
哎,原始数据应该是没有问题的,至少在图表上看来是没有问题的(有点状分布图)
但是图都已经做成tiff 了,让我把原始数据调出来是不可能的。
其实是一片文章要用的数据,平均值和error bar 都分的挺开的,但是reviewer
要求我们标上P value, 如果我不是那么仔细的话我就直接写个0.95 得了。但是
又想仔细一点。大家就别质疑这个数据的问题了。数据没有问题。
也千万别建议我去重新学统计,我们不是搞统计的,统计这种东西对于我们是一个工具,
不是我们的专业。

【在 n********t 的大作中提到】
: 把原始数据要来,至少要看一下是否有明显的outlier,以及是否离normal
: distribution太远。否则t test可能一点意义没有。

avatar
m*s
10
http://en.wikipedia.org/wiki/Student's_t-test
use one of these two following formula to calculate a t-statistic first,
Unequal sample sizes, equal variance
Unequal sample sizes, unequal variance
Then calcluate p value from a t-distribution.

【在 s******y 的大作中提到】
: 在已经知道两个样品组的平均值,采样量,以及偏差值的情况下,一般的student
: distribution如何计算P value?
: 古狗了几个网站,看的我莫名其妙,只好来问大家了。

avatar
s*s
12
wiki这里说的很清楚。你做之前有三个问题要考虑
1. sample是不是normal
2. sample是不是paired
3. 假设equal variance还是不假设
http://en.wikipedia.org/wiki/Student's_t-test

【在 s******y 的大作中提到】
: 在已经知道两个样品组的平均值,采样量,以及偏差值的情况下,一般的student
: distribution如何计算P value?
: 古狗了几个网站,看的我莫名其妙,只好来问大家了。

avatar
L*d
13
平均值:mean(x), mean(y)
样本量:n1, n2
方差(variance): v1, v2
计算t值
t = (mean(x)-mean(y))/sqrt(v1/n1+v2/n2)
df = (v1/n1+v2/n2)^2/[v1^2/(n1^2*(n1-1))+v2^2/(n2^2*(n2-1))]
然后到
http://graphpad.com/quickcalcs/PValue1.cfm
输入t和DF计算就行了

【在 s******y 的大作中提到】
: 在已经知道两个样品组的平均值,采样量,以及偏差值的情况下,一般的student
: distribution如何计算P value?
: 古狗了几个网站,看的我莫名其妙,只好来问大家了。

avatar
s*y
14
谢谢大家!!!!
avatar
d*u
15
老大,你要是写0.95那你这个数据就毁了。P value越小说明两组样品差异越大。0.95
就表示二者没啥区别。你最好还是让原作者把原始数据放在excel做个ttest,很简单的。

具,

【在 s******y 的大作中提到】
: 哎,原始数据应该是没有问题的,至少在图表上看来是没有问题的(有点状分布图)
: 但是图都已经做成tiff 了,让我把原始数据调出来是不可能的。
: 其实是一片文章要用的数据,平均值和error bar 都分的挺开的,但是reviewer
: 要求我们标上P value, 如果我不是那么仔细的话我就直接写个0.95 得了。但是
: 又想仔细一点。大家就别质疑这个数据的问题了。数据没有问题。
: 也千万别建议我去重新学统计,我们不是搞统计的,统计这种东西对于我们是一个工具,
: 不是我们的专业。

avatar
s*y
16
哦,我的意思是95% 的置信度,P < 0.05 :)
还是要谢谢你的提醒

95
的。

【在 d****u 的大作中提到】
: 老大,你要是写0.95那你这个数据就毁了。P value越小说明两组样品差异越大。0.95
: 就表示二者没啥区别。你最好还是让原作者把原始数据放在excel做个ttest,很简单的。
:
: 具,

avatar
m*c
17
你就回说,有了error bar 就有了confidence interval,有了confidence interval
就不用标屁值了。

具,

【在 s******y 的大作中提到】
: 哎,原始数据应该是没有问题的,至少在图表上看来是没有问题的(有点状分布图)
: 但是图都已经做成tiff 了,让我把原始数据调出来是不可能的。
: 其实是一片文章要用的数据,平均值和error bar 都分的挺开的,但是reviewer
: 要求我们标上P value, 如果我不是那么仔细的话我就直接写个0.95 得了。但是
: 又想仔细一点。大家就别质疑这个数据的问题了。数据没有问题。
: 也千万别建议我去重新学统计,我们不是搞统计的,统计这种东西对于我们是一个工具,
: 不是我们的专业。

avatar
D*a
18
有点状分布图就好办,图放大了打印出来量一量,就有原始数据了。这种事情我干过
avatar
l*1
19
future 学霸教了现小牛一招啊 ps: Matrix did too long lon ago.

【在 D*a 的大作中提到】
: 有点状分布图就好办,图放大了打印出来量一量,就有原始数据了。这种事情我干过
avatar
s*y
20
每组数据有50多个点,而且其中有至少30多个是在平均值附近挤成一团犹如乌云一般。
。。所以量不出来的。。。

【在 D*a 的大作中提到】
: 有点状分布图就好办,图放大了打印出来量一量,就有原始数据了。这种事情我干过
avatar
l*1
21
just try
Photoshop 弗托索普 软件 Pro version

【在 s******y 的大作中提到】
: 每组数据有50多个点,而且其中有至少30多个是在平均值附近挤成一团犹如乌云一般。
: 。。所以量不出来的。。。

avatar
s*y
22
我很懒的。总共四组数据,每组50多个点。要一个个弄出来你们不如杀了我算了,
呵呵,其实上面一个同学贴的那个网站里面有直接计算的工具。因为从理论上来说,
是可以直接从average, Stdev, n 数值推测t value 的,然后从t value 就很容易
推导出p value 了。

【在 l**********1 的大作中提到】
: just try
: Photoshop 弗托索普 软件 Pro version

avatar
D*a
23
那肯定highly significant啊?

【在 s******y 的大作中提到】
: 每组数据有50多个点,而且其中有至少30多个是在平均值附近挤成一团犹如乌云一般。
: 。。所以量不出来的。。。

avatar
s*y
24
是啊,但是现在的生物杂志都装模作样的要求数据量化了,要我们在众多图上一一
标上这个星星。不标的话就死啦死啦的。
我现在还正在发愁,如何在几大堆乌云一般的点点里面标上一个星星?
估计要标一个特大号的星星了。。。但是那样读者的注意力估计都被那么一个巨星
吸引过去了。弄不好都光看星星去不看乌云了。

【在 D*a 的大作中提到】
: 那肯定highly significant啊?
avatar
l*1
25
then please try
Image Master 2D Platinum v7.0 software link:
//www.gelifesciences.com/aptrix/upp00919.nsf/Content/
D6BE68BE61F2C8D0C1257628001D4D88/$file/28937912AB.pdf
Manual Book link:
//www.gelifesciences.com/aptrix/upp00919.nsf/Content/9C0FF92935CD327DC1257628001D4D9B/$file/
28938102AA.pdf
Reference:
2D image analysis p-values were calculated by the Image Master 2D
Platinum v7.0 software
paper link:
//www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0022810

【在 s******y 的大作中提到】
: 我很懒的。总共四组数据,每组50多个点。要一个个弄出来你们不如杀了我算了,
: 呵呵,其实上面一个同学贴的那个网站里面有直接计算的工具。因为从理论上来说,
: 是可以直接从average, Stdev, n 数值推测t value 的,然后从t value 就很容易
: 推导出p value 了。

avatar
D*a
28
他们怎么又有mean和error bar又有点图,还在一起?有一个就行了啊?

【在 s******y 的大作中提到】
: 是啊,但是现在的生物杂志都装模作样的要求数据量化了,要我们在众多图上一一
: 标上这个星星。不标的话就死啦死啦的。
: 我现在还正在发愁,如何在几大堆乌云一般的点点里面标上一个星星?
: 估计要标一个特大号的星星了。。。但是那样读者的注意力估计都被那么一个巨星
: 吸引过去了。弄不好都光看星星去不看乌云了。

avatar
s*y
29
那种很fancy 用sigma plot做出来的图啊。
类似这样的:

【在 D*a 的大作中提到】
: 他们怎么又有mean和error bar又有点图,还在一起?有一个就行了啊?
avatar
D*a
30
果然好fancy~

【在 s******y 的大作中提到】
: 那种很fancy 用sigma plot做出来的图啊。
: 类似这样的:

avatar
b*s
31
你这是啥,一个草莓,一个飞机,一个圣诞树?

【在 s******y 的大作中提到】
: 那种很fancy 用sigma plot做出来的图啊。
: 类似这样的:

avatar
d*u
32
你这个是box whiskers plot吧?为什么要把原始数据分布和box plot都放在上边呢?
难道不是只有一个就可以了吗?

【在 s******y 的大作中提到】
: 那种很fancy 用sigma plot做出来的图啊。
: 类似这样的:

avatar
s*s
33
很有意思啊。CONTROL是什么,为什么介于国内和国际之间?

【在 s******y 的大作中提到】
: 那种很fancy 用sigma plot做出来的图啊。
: 类似这样的:

avatar
s*s
34
你这些数据有OUTLIER,不能只根据MEAN,SD来算。

【在 s******y 的大作中提到】
: 那种很fancy 用sigma plot做出来的图啊。
: 类似这样的:

avatar
D*a
35
这种点能分出来,可以用尺子量啊,就是费事点儿。。。
对了或者可以用imageJ量吧,类似一群细胞到底边的距离多少?
avatar
a*k
36
有软件可以一次识别所有点的,也就一袋烟的功夫
一点不麻烦

【在 s******y 的大作中提到】
: 我很懒的。总共四组数据,每组50多个点。要一个个弄出来你们不如杀了我算了,
: 呵呵,其实上面一个同学贴的那个网站里面有直接计算的工具。因为从理论上来说,
: 是可以直接从average, Stdev, n 数值推测t value 的,然后从t value 就很容易
: 推导出p value 了。

avatar
a*k
37
现在的reviewer真无聊、
同意如果没问题的话,自己沉思一下,
很潇洒的写下"P<0.05"或者"P<0.01"之类的就可以了,注意不要忘记小于号

具,

【在 s******y 的大作中提到】
: 哎,原始数据应该是没有问题的,至少在图表上看来是没有问题的(有点状分布图)
: 但是图都已经做成tiff 了,让我把原始数据调出来是不可能的。
: 其实是一片文章要用的数据,平均值和error bar 都分的挺开的,但是reviewer
: 要求我们标上P value, 如果我不是那么仔细的话我就直接写个0.95 得了。但是
: 又想仔细一点。大家就别质疑这个数据的问题了。数据没有问题。
: 也千万别建议我去重新学统计,我们不是搞统计的,统计这种东西对于我们是一个工具,
: 不是我们的专业。

avatar
e*o
38

有软件可以提取数据。
原理也是量,不过不用打印出来。

【在 D*a 的大作中提到】
: 有点状分布图就好办,图放大了打印出来量一量,就有原始数据了。这种事情我干过
avatar
e*o
39

这图看着好欢乐。

【在 s******y 的大作中提到】
: 那种很fancy 用sigma plot做出来的图啊。
: 类似这样的:

avatar
s*y
40
呵呵,这个不是我的数据,而是我随便在网上找了一个栗子来告诉Dua 如何
同时做点分布和平均值什么的。 我的数据比这个好看得多了。

【在 s********s 的大作中提到】
: 很有意思啊。CONTROL是什么,为什么介于国内和国际之间?
avatar
h*n
41
万一是对数坐标咋办?

【在 D*a 的大作中提到】
: 有点状分布图就好办,图放大了打印出来量一量,就有原始数据了。这种事情我干过
avatar
s*j
42
还没量出来呢? 你把你的图贴上来. 让大家用自己推荐的方法弄, 看谁最快最好.

【在 s******y 的大作中提到】
: 我很懒的。总共四组数据,每组50多个点。要一个个弄出来你们不如杀了我算了,
: 呵呵,其实上面一个同学贴的那个网站里面有直接计算的工具。因为从理论上来说,
: 是可以直接从average, Stdev, n 数值推测t value 的,然后从t value 就很容易
: 推导出p value 了。

avatar
s*j
43
对数坐标不一样的量吗? 有什么区别?

【在 h********n 的大作中提到】
: 万一是对数坐标咋办?
avatar
s*y
44
一大早就量完了。
用的是这个方法:
发信人: blueswing (blueswing), 信区: Biology
标 题: Re: 如何算P value?
发信站: BBS 未名空间站 (Tue Apr 10 18:44:21 2012, 美东)
http://graphpad.com/quickcalcs/ttest1.cfm?Format=S

【在 s*****j 的大作中提到】
: 对数坐标不一样的量吗? 有什么区别?
avatar
s*j
45
我不是问这个, 是怎么从tiff图里取数据点.
那个方法最简单, 我现在也需要.

【在 s******y 的大作中提到】
: 一大早就量完了。
: 用的是这个方法:
: 发信人: blueswing (blueswing), 信区: Biology
: 标 题: Re: 如何算P value?
: 发信站: BBS 未名空间站 (Tue Apr 10 18:44:21 2012, 美东)
: http://graphpad.com/quickcalcs/ttest1.cfm?Format=S

avatar
s*y
46
我那么懒的人,怎么会去做从图里取点的事情呢?
反正有更简单的方法我当然是用简单的了

【在 s*****j 的大作中提到】
: 我不是问这个, 是怎么从tiff图里取数据点.
: 那个方法最简单, 我现在也需要.

avatar
s*s
47
没有原始data,没有software,又想快速获得p的。
最简单的应该是rank test了,而且可能更加粗糙一些,
用尺画个十条水平线,每个区间都算一样的rank,那么
只要扳手指数一下就行了。这个连normality都不用

【在 s******y 的大作中提到】
: 我那么懒的人,怎么会去做从图里取点的事情呢?
: 反正有更简单的方法我当然是用简单的了

avatar
r*t
48
这个 t test 本科概率统计肯定学过的,就是当工具学的。

具,

【在 s******y 的大作中提到】
: 哎,原始数据应该是没有问题的,至少在图表上看来是没有问题的(有点状分布图)
: 但是图都已经做成tiff 了,让我把原始数据调出来是不可能的。
: 其实是一片文章要用的数据,平均值和error bar 都分的挺开的,但是reviewer
: 要求我们标上P value, 如果我不是那么仔细的话我就直接写个0.95 得了。但是
: 又想仔细一点。大家就别质疑这个数据的问题了。数据没有问题。
: 也千万别建议我去重新学统计,我们不是搞统计的,统计这种东西对于我们是一个工具,
: 不是我们的专业。

avatar
r*t
49
这个跟偏离 normal 没有关系。

【在 n********t 的大作中提到】
: 把原始数据要来,至少要看一下是否有明显的outlier,以及是否离normal
: distribution太远。否则t test可能一点意义没有。

avatar
s*s
50
刚看到你这条。你有这么多数据点,那就更本不用在乎是不是normal
distribution, 根据CTL,只要数据不是垃圾到你无法想象的程度,直接
上t就可以了,再进一步,连t都没有必要用了,直接最最简单的z test
足够准确了

【在 s******y 的大作中提到】
: 每组数据有50多个点,而且其中有至少30多个是在平均值附近挤成一团犹如乌云一般。
: 。。所以量不出来的。。。

avatar
b*n
51
这个貌似很简单啊, 直接看看95%置信区间是不是重合就知道P是不是小于5%了。
avatar
n*t
52
比较两组独立数据mean是否相同的t-test不需要normal的assumption?

【在 r****t 的大作中提到】
: 这个跟偏离 normal 没有关系。
avatar
D*a
53
imageJ量点(到底边)的高度。
我还量过曲线(老paper截图),给了上千个值,excel删了五分之一的点再画图还是看
不出来缝隙。

【在 s*****j 的大作中提到】
: 我不是问这个, 是怎么从tiff图里取数据点.
: 那个方法最简单, 我现在也需要.

avatar
s*s
54
这个assumption"几乎"不需要
因为这个t-test实际上不是比sample得distribution, 而是在看sample mean的
distribution. 而根据统计学里面最最最重要的central limit theorem (相当
于中心法则),只要这个sample distribution不是太变态,sample数目越多,
sample mean就越接近normal. 这个基本上15就算多了,30个基本上就非常非常
normal了,所以这个t-test normality只有在sample size只有十个左右的时候
才比较重要;另外,如果sample size太小,反而不能用t,只能non-parametric

【在 n********t 的大作中提到】
: 比较两组独立数据mean是否相同的t-test不需要normal的assumption?
avatar
c*r
55
这个中心极限定理只对“每个变量有个多重复测量的数据”有效。如果测量值不
是重复测量,那么其分布大多不是正态分布。例如比较南方人和北方人的身高,基本上
是对数正态分布,就是对数变换后才是正态分布。
另外,15或30个重复测量只能让分布“看上去”很像正态,并非严格正态(可用Lilliefors test检验之)。不过接近正态也就可以了。数据不是正态但想用t test的,可以做数据变换,比如取对数和幂变换等;怎么变换都达不到正态,那就用非参数检验了,如Mann-Whitney test。
生物文章其实对统计卡得一点都不严,比如3个重复就上t test的到处都是。

【在 s******s 的大作中提到】
: 这个assumption"几乎"不需要
: 因为这个t-test实际上不是比sample得distribution, 而是在看sample mean的
: distribution. 而根据统计学里面最最最重要的central limit theorem (相当
: 于中心法则),只要这个sample distribution不是太变态,sample数目越多,
: sample mean就越接近normal. 这个基本上15就算多了,30个基本上就非常非常
: normal了,所以这个t-test normality只有在sample size只有十个左右的时候
: 才比较重要;另外,如果sample size太小,反而不能用t,只能non-parametric

avatar
s*s
56
你说的全对,不过同时又错了。
确实sample不是normal,但是t-test本身不是比sample得distribution,
而是看sample mean的distribution. 那50个sample本身不是多次重复测量,
但是看sample mean的话,就相当于多次重复测量“每次取50个sample,取mean”,
所以中心定理是应用的。
那个对数正态已经比较极端了,但是我做了一下模拟,50个sample mean,其实
中间的分布qqnorm已经是直线了,只有两头outlier比较厉害而已。

Lilliefors test检验之)。不过接近正态也就可以了。数据不是正态但想用t test的
,可以做数据变换,比如取对数和幂变换等;怎么变换都达不到正态,那就用非参数检
验了,如Mann-Whitney test。

【在 c****r 的大作中提到】
: 这个中心极限定理只对“每个变量有个多重复测量的数据”有效。如果测量值不
: 是重复测量,那么其分布大多不是正态分布。例如比较南方人和北方人的身高,基本上
: 是对数正态分布,就是对数变换后才是正态分布。
: 另外,15或30个重复测量只能让分布“看上去”很像正态,并非严格正态(可用Lilliefors test检验之)。不过接近正态也就可以了。数据不是正态但想用t test的,可以做数据变换,比如取对数和幂变换等;怎么变换都达不到正态,那就用非参数检验了,如Mann-Whitney test。
: 生物文章其实对统计卡得一点都不严,比如3个重复就上t test的到处都是。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。