h*y
2 楼
最近给网站做了些风格调整,其中网页的背景是磨砂效果的,基本色调是
#2e2c30,比较暗,我在我的EEEPC上看很满意,但在CRT显示器上看就是黑
色,在CRT显示器上调好后在EEEPC的液晶显示器上又没有磨砂效果了。我
折中后就是现在的样子。这里没有其他测试方法,大家帮忙看看效果如何。
#2e2c30,比较暗,我在我的EEEPC上看很满意,但在CRT显示器上看就是黑
色,在CRT显示器上调好后在EEEPC的液晶显示器上又没有磨砂效果了。我
折中后就是现在的样子。这里没有其他测试方法,大家帮忙看看效果如何。
a*n
3 楼
我感觉 one sample T-test 算 p-value就是忽悠人的。。
就是说知道一个均值A,然后做实验,算一组sample跟这个均值A的 P-value,我觉得没
有意义啊,好像只要 sample 只要足够大,最后的p-value肯定很小啊,(因为实验均值
完全等于这个A的可能性太小了),等样本数量变大之后,是不是p-value就会变小?比
方一个大小为 50,均值为 40的样本跟A=50算出来的pvalue 明显会大于 大小为50000,
但是均值也是40的样本跟A=50算出来的p-value ?
就是说知道一个均值A,然后做实验,算一组sample跟这个均值A的 P-value,我觉得没
有意义啊,好像只要 sample 只要足够大,最后的p-value肯定很小啊,(因为实验均值
完全等于这个A的可能性太小了),等样本数量变大之后,是不是p-value就会变小?比
方一个大小为 50,均值为 40的样本跟A=50算出来的pvalue 明显会大于 大小为50000,
但是均值也是40的样本跟A=50算出来的p-value ?
F*i
4 楼
请问 怎么生成象
http://perldoc.perl.org/functions/wantarray.html
这样有syntax highlight 的 perl script html ?
有什么free 的工具吗?
谢谢
http://perldoc.perl.org/functions/wantarray.html
这样有syntax highlight 的 perl script html ?
有什么free 的工具吗?
谢谢
s*e
5 楼
发信人: sunnerface (fangzi), 信区: JobHunting
标 题: 借人气请教一下如何选择phd学校的offer
发信站: BBS 未名空间站 (Fri Mar 14 22:42:36 2008)
Lehigh ie的offer VS PSU ee的offer
前者导师和方向还没定,去了才选,后者是铁电铁磁材料
不知道就业方面哪个专业好就业?
学校名气呢?Lehigh和PSU哪个就业更好?
谢谢前辈们!
标 题: 借人气请教一下如何选择phd学校的offer
发信站: BBS 未名空间站 (Fri Mar 14 22:42:36 2008)
Lehigh ie的offer VS PSU ee的offer
前者导师和方向还没定,去了才选,后者是铁电铁磁材料
不知道就业方面哪个专业好就业?
学校名气呢?Lehigh和PSU哪个就业更好?
谢谢前辈们!
d*e
8 楼
r*t
9 楼
open it with Vim, then
也有 enscript 这些专业搞这个的,懒得装来用。
也有 enscript 这些专业搞这个的,懒得装来用。
d*a
10 楼
PSU is better but 电铁磁材料, hmmm
c*h
16 楼
如果明知均值是A的话,那的确没什么意义
但如果你不知道,只是猜均值可能是A,那p-value就能大概验证一下你猜得对不对
均值
50000,
【在 a***n 的大作中提到】
: 我感觉 one sample T-test 算 p-value就是忽悠人的。。
: 就是说知道一个均值A,然后做实验,算一组sample跟这个均值A的 P-value,我觉得没
: 有意义啊,好像只要 sample 只要足够大,最后的p-value肯定很小啊,(因为实验均值
: 完全等于这个A的可能性太小了),等样本数量变大之后,是不是p-value就会变小?比
: 方一个大小为 50,均值为 40的样本跟A=50算出来的pvalue 明显会大于 大小为50000,
: 但是均值也是40的样本跟A=50算出来的p-value ?
但如果你不知道,只是猜均值可能是A,那p-value就能大概验证一下你猜得对不对
均值
50000,
【在 a***n 的大作中提到】
: 我感觉 one sample T-test 算 p-value就是忽悠人的。。
: 就是说知道一个均值A,然后做实验,算一组sample跟这个均值A的 P-value,我觉得没
: 有意义啊,好像只要 sample 只要足够大,最后的p-value肯定很小啊,(因为实验均值
: 完全等于这个A的可能性太小了),等样本数量变大之后,是不是p-value就会变小?比
: 方一个大小为 50,均值为 40的样本跟A=50算出来的pvalue 明显会大于 大小为50000,
: 但是均值也是40的样本跟A=50算出来的p-value ?
a*n
18 楼
可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
我刚刚模拟了下:
mu = 2.9
sample1 = {1,2,3,4,5}
sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
大。
【在 c*******h 的大作中提到】
: 如果明知均值是A的话,那的确没什么意义
: 但如果你不知道,只是猜均值可能是A,那p-value就能大概验证一下你猜得对不对
:
: 均值
: 50000,
我刚刚模拟了下:
mu = 2.9
sample1 = {1,2,3,4,5}
sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
大。
【在 c*******h 的大作中提到】
: 如果明知均值是A的话,那的确没什么意义
: 但如果你不知道,只是猜均值可能是A,那p-value就能大概验证一下你猜得对不对
:
: 均值
: 50000,
c*h
19 楼
sample多少当然有影响么
还有就是ttest的话是看0和1两头的,无论是靠近0还是靠近1都不是什么好事
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
还有就是ttest的话是看0和1两头的,无论是靠近0还是靠近1都不是什么好事
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
a*n
25 楼
reject null hypothsis 不是好事么?
汗死。。。你讲得这个你觉得我pvalue都编程算出来了,会不知道。。晕啊。
我以为你说pvalue太小了也不能reject了。所以不是什么好事。。原来你的意思是
reject了,就不是好事了。看来咱么对于好事坏事的理解有区别啊。呵呵。 不是一直
都是区别大是好事么?reject是好事么?
【在 c*******h 的大作中提到】
: p-value太大或者太小都是要reject null hypothesis的,也就是说sample mean
: 不支持你猜的那个值
: 简单理解一下,你给5个sample估计mean是2.9,大概也说不了啥。但是你给了
: 1050个sample来估计,还硬要说人家的mean是2.9,当然不干了
: 唉,出门左转11809帖。不是我没耐性,的确是对你好
汗死。。。你讲得这个你觉得我pvalue都编程算出来了,会不知道。。晕啊。
我以为你说pvalue太小了也不能reject了。所以不是什么好事。。原来你的意思是
reject了,就不是好事了。看来咱么对于好事坏事的理解有区别啊。呵呵。 不是一直
都是区别大是好事么?reject是好事么?
【在 c*******h 的大作中提到】
: p-value太大或者太小都是要reject null hypothesis的,也就是说sample mean
: 不支持你猜的那个值
: 简单理解一下,你给5个sample估计mean是2.9,大概也说不了啥。但是你给了
: 1050个sample来估计,还硬要说人家的mean是2.9,当然不干了
: 唉,出门左转11809帖。不是我没耐性,的确是对你好
a*n
27 楼
算了,我也不跟你扯了,一个连别人问题都不仔细看就在这里说来说去的,问了也没有
意思。
我的问题明明是: 假设显著不同是好事,我问你为什么前面说P值太小或者太大不是好
事。
你反倒给我解释起来为啥p值小要reject null hypothsis. 感情我真的没学过统计。
nnd
这年头。
【在 c*******h 的大作中提到】
: p-value太大或者太小都是要reject null hypothesis的,也就是说sample mean
: 不支持你猜的那个值
: 简单理解一下,你给5个sample估计mean是2.9,大概也说不了啥。但是你给了
: 1050个sample来估计,还硬要说人家的mean是2.9,当然不干了
: 唉,出门左转11809帖。不是我没耐性,的确是对你好
意思。
我的问题明明是: 假设显著不同是好事,我问你为什么前面说P值太小或者太大不是好
事。
你反倒给我解释起来为啥p值小要reject null hypothsis. 感情我真的没学过统计。
nnd
这年头。
【在 c*******h 的大作中提到】
: p-value太大或者太小都是要reject null hypothesis的,也就是说sample mean
: 不支持你猜的那个值
: 简单理解一下,你给5个sample估计mean是2.9,大概也说不了啥。但是你给了
: 1050个sample来估计,还硬要说人家的mean是2.9,当然不干了
: 唉,出门左转11809帖。不是我没耐性,的确是对你好
g*t
28 楼
所有的统计检验都一样,样本量一大基本上都会拒绝零假设。比如说我做全基因组分析
,所有的分布就算看上去再接近正态也过不了KS检验(包括一些从逻辑上符合中心极限
定理的分布),因为全基因组尺度的样本容量太大了(上万)。所以有一种观点认为,
零假设永远是错误的。
,所有的分布就算看上去再接近正态也过不了KS检验(包括一些从逻辑上符合中心极限
定理的分布),因为全基因组尺度的样本容量太大了(上万)。所以有一种观点认为,
零假设永远是错误的。
g*t
30 楼
我看过的书中有一本讲过相关的问题:
Experimental Design and Data Analysis for Biologists
中文版
http://www.china-pub.com/627784
英文版
http://www.amazon.com/Experimental-Design-Data-Analysis-Biologists/dp/0521009766
有兴趣的话可以去图书馆里借来看一看(中文版翻译的很烂)
Experimental Design and Data Analysis for Biologists
中文版
http://www.china-pub.com/627784
英文版
http://www.amazon.com/Experimental-Design-Data-Analysis-Biologists/dp/0521009766
有兴趣的话可以去图书馆里借来看一看(中文版翻译的很烂)
a*n
31 楼
谢谢哦~
看了下内容,好像大部分内容也都学过了,从基本的统计到后面的ANOVA等等,不过看
生物的东西我比较头大啊,呵呵。还是对于 Bayesian 抨击 null hypothesis的文章比
较感兴趣,或者不知道有没有什么别的方法可以取代 hypothesis test, 尤其是point
hypothesis test. 假定 point null hypothesis 永远都会被拒绝的话。
【在 g**********t 的大作中提到】
: 我看过的书中有一本讲过相关的问题:
: Experimental Design and Data Analysis for Biologists
: 中文版
: http://www.china-pub.com/627784
: 英文版
: http://www.amazon.com/Experimental-Design-Data-Analysis-Biologists/dp/0521009766
: 有兴趣的话可以去图书馆里借来看一看(中文版翻译的很烂)
看了下内容,好像大部分内容也都学过了,从基本的统计到后面的ANOVA等等,不过看
生物的东西我比较头大啊,呵呵。还是对于 Bayesian 抨击 null hypothesis的文章比
较感兴趣,或者不知道有没有什么别的方法可以取代 hypothesis test, 尤其是point
hypothesis test. 假定 point null hypothesis 永远都会被拒绝的话。
【在 g**********t 的大作中提到】
: 我看过的书中有一本讲过相关的问题:
: Experimental Design and Data Analysis for Biologists
: 中文版
: http://www.china-pub.com/627784
: 英文版
: http://www.amazon.com/Experimental-Design-Data-Analysis-Biologists/dp/0521009766
: 有兴趣的话可以去图书馆里借来看一看(中文版翻译的很烂)
h*n
32 楼
你这个sample 不能这么取
t test是假设error满足正态分布。
你这个是uniform distribution,拿t test算p value当然不对。
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
t test是假设error满足正态分布。
你这个是uniform distribution,拿t test算p value当然不对。
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
s*5
35 楼
19楼正解
A*e
36 楼
这个问题我也是思考了一年多了,有些浅的想法,大家拍拍砖头 :)
先说两点老生常谈的大原则:
1。统计的意义,不是告诉你 truth,而是告诉你 possibility (p-value),然后你
自己根据 cost function 来选择判断标准/风险标准(比如说 alpha value),对比 p
-value 来做 decision。这一点至关重要。换句话说,统计是工具,是 case
orientated。
2。Context 是决定性的。同样的统计结果,不同 context (case)下,意义可能大相
径庭,decision 可能完全不一样。苹果分拣分级设备如果有 5% 的分级错误概率,是
可以接受的,降落伞如果有 5% 的打不开的概率就是灾难性的。抽离开具体的 case,
单纯地说 p=.05 是没有任何指导意义的。
然后具体到 t-test 来。t-test 和其它常见假设检验的初始 context 是:在工程领域
,在寻求体系的改善时,在有限的资源下(时间/人力/物力),如何能够尽可能安全地
确认 H_o 是错误的(所谓的 H_o 保护)。这个 context 可以具体
【在 a***n 的大作中提到】
: 我感觉 one sample T-test 算 p-value就是忽悠人的。。
: 就是说知道一个均值A,然后做实验,算一组sample跟这个均值A的 P-value,我觉得没
: 有意义啊,好像只要 sample 只要足够大,最后的p-value肯定很小啊,(因为实验均值
: 完全等于这个A的可能性太小了),等样本数量变大之后,是不是p-value就会变小?比
: 方一个大小为 50,均值为 40的样本跟A=50算出来的pvalue 明显会大于 大小为50000,
: 但是均值也是40的样本跟A=50算出来的p-value ?
先说两点老生常谈的大原则:
1。统计的意义,不是告诉你 truth,而是告诉你 possibility (p-value),然后你
自己根据 cost function 来选择判断标准/风险标准(比如说 alpha value),对比 p
-value 来做 decision。这一点至关重要。换句话说,统计是工具,是 case
orientated。
2。Context 是决定性的。同样的统计结果,不同 context (case)下,意义可能大相
径庭,decision 可能完全不一样。苹果分拣分级设备如果有 5% 的分级错误概率,是
可以接受的,降落伞如果有 5% 的打不开的概率就是灾难性的。抽离开具体的 case,
单纯地说 p=.05 是没有任何指导意义的。
然后具体到 t-test 来。t-test 和其它常见假设检验的初始 context 是:在工程领域
,在寻求体系的改善时,在有限的资源下(时间/人力/物力),如何能够尽可能安全地
确认 H_o 是错误的(所谓的 H_o 保护)。这个 context 可以具体
【在 a***n 的大作中提到】
: 我感觉 one sample T-test 算 p-value就是忽悠人的。。
: 就是说知道一个均值A,然后做实验,算一组sample跟这个均值A的 P-value,我觉得没
: 有意义啊,好像只要 sample 只要足够大,最后的p-value肯定很小啊,(因为实验均值
: 完全等于这个A的可能性太小了),等样本数量变大之后,是不是p-value就会变小?比
: 方一个大小为 50,均值为 40的样本跟A=50算出来的pvalue 明显会大于 大小为50000,
: 但是均值也是40的样本跟A=50算出来的p-value ?
a*n
38 楼
同意啊。 做学术的用t-test恐怕没有考虑成本的吧,都是sample大了不要紧,只要达到
目的。有时候想想真不知道这个test究竟是干什么的。我困惑的也就是这个。。。
p
【在 A**********e 的大作中提到】
: 这个问题我也是思考了一年多了,有些浅的想法,大家拍拍砖头 :)
: 先说两点老生常谈的大原则:
: 1。统计的意义,不是告诉你 truth,而是告诉你 possibility (p-value),然后你
: 自己根据 cost function 来选择判断标准/风险标准(比如说 alpha value),对比 p
: -value 来做 decision。这一点至关重要。换句话说,统计是工具,是 case
: orientated。
: 2。Context 是决定性的。同样的统计结果,不同 context (case)下,意义可能大相
: 径庭,decision 可能完全不一样。苹果分拣分级设备如果有 5% 的分级错误概率,是
: 可以接受的,降落伞如果有 5% 的打不开的概率就是灾难性的。抽离开具体的 case,
: 单纯地说 p=.05 是没有任何指导意义的。
目的。有时候想想真不知道这个test究竟是干什么的。我困惑的也就是这个。。。
p
【在 A**********e 的大作中提到】
: 这个问题我也是思考了一年多了,有些浅的想法,大家拍拍砖头 :)
: 先说两点老生常谈的大原则:
: 1。统计的意义,不是告诉你 truth,而是告诉你 possibility (p-value),然后你
: 自己根据 cost function 来选择判断标准/风险标准(比如说 alpha value),对比 p
: -value 来做 decision。这一点至关重要。换句话说,统计是工具,是 case
: orientated。
: 2。Context 是决定性的。同样的统计结果,不同 context (case)下,意义可能大相
: 径庭,decision 可能完全不一样。苹果分拣分级设备如果有 5% 的分级错误概率,是
: 可以接受的,降落伞如果有 5% 的打不开的概率就是灾难性的。抽离开具体的 case,
: 单纯地说 p=.05 是没有任何指导意义的。
d*e
39 楼
http://en.wikipedia.org/wiki/Type_I_error#Type_I_error
你还是没有明白什么是Test的目的。
首先你要知道有两种误差,分别是I型和II型,你不能同时最小化两个,所以通常来讲
是固定其中一个来最小化另一个,所以无论怎么样误差都是存在的。就算p-value算出
来接近0,也仍然有误差的可能。
你想举例子说明p-value的实际意义大不大,无非就是举误差存在的情况罢了。误差的
可接受程度和estimator的Risk有关。
如果你针对其中的理论感兴趣,Non-centrality F Test里面解释的很好。
【在 a***n 的大作中提到】
: 我那个例子的分布确实不是正态的,不过那只是我随便举得一个例子而已,如果有其他
: 的确定的正太分布的大小不同的sample,结果应该也会出现那样的p值逐渐变小的情况
: 吧。
: 我这个post主要还是想讨论下one smaple ttest的p值的实际意义到底大不大。不是纠
: 缠于具体的细节。
你还是没有明白什么是Test的目的。
首先你要知道有两种误差,分别是I型和II型,你不能同时最小化两个,所以通常来讲
是固定其中一个来最小化另一个,所以无论怎么样误差都是存在的。就算p-value算出
来接近0,也仍然有误差的可能。
你想举例子说明p-value的实际意义大不大,无非就是举误差存在的情况罢了。误差的
可接受程度和estimator的Risk有关。
如果你针对其中的理论感兴趣,Non-centrality F Test里面解释的很好。
【在 a***n 的大作中提到】
: 我那个例子的分布确实不是正态的,不过那只是我随便举得一个例子而已,如果有其他
: 的确定的正太分布的大小不同的sample,结果应该也会出现那样的p值逐渐变小的情况
: 吧。
: 我这个post主要还是想讨论下one smaple ttest的p值的实际意义到底大不大。不是纠
: 缠于具体的细节。
s*r
40 楼
T-TEST以及任何一个TEST都有若干假设,
比如相互独立(像1,2,3,4,5,1,2,3,4,5...之类的序列就不满足)。
网上问答认不得真,WIKI算是底线,最好找本入门的教科书。
统计本身是SOLID SCIENCE,忽悠人的是统计学家,而且通常是在
医生或NIH的逼迫下干的。
比如相互独立(像1,2,3,4,5,1,2,3,4,5...之类的序列就不满足)。
网上问答认不得真,WIKI算是底线,最好找本入门的教科书。
统计本身是SOLID SCIENCE,忽悠人的是统计学家,而且通常是在
医生或NIH的逼迫下干的。
s*r
41 楼
“你还是没有明白什么是Test的目的”
这句话说到了点子上。I、II类错误与这个问题很有关系,但对于非统专业的深了点。
TEST的目的很重要,所以在工农业和医学实验中选择原假设和备选假设是很小心的。浅
显言之,当你有足够大的样本,或者样本间的差异很小,T-TEST对你意义不大,因为
你知道得到的均值估计是很精确的。只有当你的样本量有限(由于成本或其他原因),
你才担心均值估计准不准,是否要考虑随机波动的大小。一个原假设的提出有没有意义
,取决于需不需要(以及能不能得到)充分的证据来推翻它,这样才符合“保险起见”
的生活常识。
这句话说到了点子上。I、II类错误与这个问题很有关系,但对于非统专业的深了点。
TEST的目的很重要,所以在工农业和医学实验中选择原假设和备选假设是很小心的。浅
显言之,当你有足够大的样本,或者样本间的差异很小,T-TEST对你意义不大,因为
你知道得到的均值估计是很精确的。只有当你的样本量有限(由于成本或其他原因),
你才担心均值估计准不准,是否要考虑随机波动的大小。一个原假设的提出有没有意义
,取决于需不需要(以及能不能得到)充分的证据来推翻它,这样才符合“保险起见”
的生活常识。
a*n
42 楼
如此说来,转了一圈,好像又回到了原来的问题上,既然test有各种各样的条件:适用
背景,样本大小。。。
那么貌似怎么做出能否使用ttest又变成了一个问题,比方对于不同的实验,什么样的样
本大小叫合适?
如果统计的人没法给出这样的定义,那么test方法本身好像意义也不大了。另外貌似很
多情况下,我指paper里面,使用的各种test的情况并非像搞统计的人说的样本容量有
限,没有办法才使用这样的方法去估计,实际上是有大量的样本,为了得到一个
hypothesis的正确验证而去做的这样的test,也就是我的标题所在。因为很多情况下,
尤其cs的paper里面,得到大量的数据好像并非难事,或者说并非不可能。那样的话,
那么多的paper里面使用这样的test不是变成了trick了么?既然sample可以变,p值也
能变。而这样使用test的paper恐怕不少吧。
【在 s******r 的大作中提到】
: “你还是没有明白什么是Test的目的”
: 这句话说到了点子上。I、II类错误与这个问题很有关系,但对于非统专业的深了点。
: TEST的目的很重要,所以在工农业和医学实验中选择原假设和备选假设是很小心的。浅
: 显言之,当你有足够大的样本,或者样本间的差异很小,T-TEST对你意义不大,因为
: 你知道得到的均值估计是很精确的。只有当你的样本量有限(由于成本或其他原因),
: 你才担心均值估计准不准,是否要考虑随机波动的大小。一个原假设的提出有没有意义
: ,取决于需不需要(以及能不能得到)充分的证据来推翻它,这样才符合“保险起见”
: 的生活常识。
背景,样本大小。。。
那么貌似怎么做出能否使用ttest又变成了一个问题,比方对于不同的实验,什么样的样
本大小叫合适?
如果统计的人没法给出这样的定义,那么test方法本身好像意义也不大了。另外貌似很
多情况下,我指paper里面,使用的各种test的情况并非像搞统计的人说的样本容量有
限,没有办法才使用这样的方法去估计,实际上是有大量的样本,为了得到一个
hypothesis的正确验证而去做的这样的test,也就是我的标题所在。因为很多情况下,
尤其cs的paper里面,得到大量的数据好像并非难事,或者说并非不可能。那样的话,
那么多的paper里面使用这样的test不是变成了trick了么?既然sample可以变,p值也
能变。而这样使用test的paper恐怕不少吧。
【在 s******r 的大作中提到】
: “你还是没有明白什么是Test的目的”
: 这句话说到了点子上。I、II类错误与这个问题很有关系,但对于非统专业的深了点。
: TEST的目的很重要,所以在工农业和医学实验中选择原假设和备选假设是很小心的。浅
: 显言之,当你有足够大的样本,或者样本间的差异很小,T-TEST对你意义不大,因为
: 你知道得到的均值估计是很精确的。只有当你的样本量有限(由于成本或其他原因),
: 你才担心均值估计准不准,是否要考虑随机波动的大小。一个原假设的提出有没有意义
: ,取决于需不需要(以及能不能得到)充分的证据来推翻它,这样才符合“保险起见”
: 的生活常识。
a*n
43 楼
统计也不是什么solid science吧,hypothesis test 在统计内部都是有争论的东西。你
搜一搜就知道了。
我只是感慨下这么多paper都是在玩统计的trick,没想到这么多人来给我解释统计的意
义。呵呵。换句话讲,如果真的统计这么solid的话,别人想玩也没那么容易了。
另外,这么帖子再讨论下去貌似也没啥意义了。
【在 s******r 的大作中提到】
: T-TEST以及任何一个TEST都有若干假设,
: 比如相互独立(像1,2,3,4,5,1,2,3,4,5...之类的序列就不满足)。
: 网上问答认不得真,WIKI算是底线,最好找本入门的教科书。
: 统计本身是SOLID SCIENCE,忽悠人的是统计学家,而且通常是在
: 医生或NIH的逼迫下干的。
搜一搜就知道了。
我只是感慨下这么多paper都是在玩统计的trick,没想到这么多人来给我解释统计的意
义。呵呵。换句话讲,如果真的统计这么solid的话,别人想玩也没那么容易了。
另外,这么帖子再讨论下去貌似也没啥意义了。
【在 s******r 的大作中提到】
: T-TEST以及任何一个TEST都有若干假设,
: 比如相互独立(像1,2,3,4,5,1,2,3,4,5...之类的序列就不满足)。
: 网上问答认不得真,WIKI算是底线,最好找本入门的教科书。
: 统计本身是SOLID SCIENCE,忽悠人的是统计学家,而且通常是在
: 医生或NIH的逼迫下干的。
d*e
44 楼
我都告诉你去看noncentral F-test了,里面明确给出了sample size和各种error的关
系。
的样
【在 a***n 的大作中提到】
: 如此说来,转了一圈,好像又回到了原来的问题上,既然test有各种各样的条件:适用
: 背景,样本大小。。。
: 那么貌似怎么做出能否使用ttest又变成了一个问题,比方对于不同的实验,什么样的样
: 本大小叫合适?
: 如果统计的人没法给出这样的定义,那么test方法本身好像意义也不大了。另外貌似很
: 多情况下,我指paper里面,使用的各种test的情况并非像搞统计的人说的样本容量有
: 限,没有办法才使用这样的方法去估计,实际上是有大量的样本,为了得到一个
: hypothesis的正确验证而去做的这样的test,也就是我的标题所在。因为很多情况下,
: 尤其cs的paper里面,得到大量的数据好像并非难事,或者说并非不可能。那样的话,
: 那么多的paper里面使用这样的test不是变成了trick了么?既然sample可以变,p值也
系。
的样
【在 a***n 的大作中提到】
: 如此说来,转了一圈,好像又回到了原来的问题上,既然test有各种各样的条件:适用
: 背景,样本大小。。。
: 那么貌似怎么做出能否使用ttest又变成了一个问题,比方对于不同的实验,什么样的样
: 本大小叫合适?
: 如果统计的人没法给出这样的定义,那么test方法本身好像意义也不大了。另外貌似很
: 多情况下,我指paper里面,使用的各种test的情况并非像搞统计的人说的样本容量有
: 限,没有办法才使用这样的方法去估计,实际上是有大量的样本,为了得到一个
: hypothesis的正确验证而去做的这样的test,也就是我的标题所在。因为很多情况下,
: 尤其cs的paper里面,得到大量的数据好像并非难事,或者说并非不可能。那样的话,
: 那么多的paper里面使用这样的test不是变成了trick了么?既然sample可以变,p值也
N*D
46 楼
there are two kind oflies
lies, and statistics
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
lies, and statistics
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
w*i
47 楼
descriptive statistics never lie
inference statistics could be wrong, but that's much more likely to be
interpreted by a liar, or an ignorant.
inference statistics could be wrong, but that's much more likely to be
interpreted by a liar, or an ignorant.
w*i
48 楼
You test makes perfect sense, with small sample size, there is a bigger
probability (p-value) that your
sample mean is 3.0 while the the real mean (H0) is 2.9, with bigger sample
size (hence greater power),
this probability drops, so you reject the null hypothesis(mu=2.9), which
reflects the truth, the mean is
3.0, not 2.9. In this case the null hypothesis should be rejected, it's
just with a big sample size you are
more confident to reject the null while with small sample size you are not
so
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
probability (p-value) that your
sample mean is 3.0 while the the real mean (H0) is 2.9, with bigger sample
size (hence greater power),
this probability drops, so you reject the null hypothesis(mu=2.9), which
reflects the truth, the mean is
3.0, not 2.9. In this case the null hypothesis should be rejected, it's
just with a big sample size you are
more confident to reject the null while with small sample size you are not
so
【在 a***n 的大作中提到】
: 可是我感觉分布如果真的未知的话,sample的大小对于 p-value的影响还是很大的啊。
: 我刚刚模拟了下:
: mu = 2.9
: sample1 = {1,2,3,4,5}
: sample2 = {1,2,3,4,5, ... 1,2,3,4,5} 有210个1,2,3,4,5的数列。
: sample1和sample2 算下来的pvalue 差异太大。 第一个接近1,第二个0.02
: 但是如果分布为止,我觉得这个p-value跟sample 的大小关系很密切,所以好像意义不
: 大。
l*g
49 楼
同意楼上的观点,楼主对于统计可以说根本没有入门。而且你这里的题目说的是one
sample t-test,首先你对于sample level没有解释,如果只有一个level,那么你做t-
test或者说无论什么level的test都没有意义。 sample size的增大只是为了提高统计
的power因为他够精确。 t-test是针对于2level的比较,你的例子我不知道你在比较什
么,而且事实上不同levelsamplesize不一样也有很大的影响。建议去找本基本的统计
书来看。
【在 w****i 的大作中提到】
: You test makes perfect sense, with small sample size, there is a bigger
: probability (p-value) that your
: sample mean is 3.0 while the the real mean (H0) is 2.9, with bigger sample
: size (hence greater power),
: this probability drops, so you reject the null hypothesis(mu=2.9), which
: reflects the truth, the mean is
: 3.0, not 2.9. In this case the null hypothesis should be rejected, it's
: just with a big sample size you are
: more confident to reject the null while with small sample size you are not
: so
sample t-test,首先你对于sample level没有解释,如果只有一个level,那么你做t-
test或者说无论什么level的test都没有意义。 sample size的增大只是为了提高统计
的power因为他够精确。 t-test是针对于2level的比较,你的例子我不知道你在比较什
么,而且事实上不同levelsamplesize不一样也有很大的影响。建议去找本基本的统计
书来看。
【在 w****i 的大作中提到】
: You test makes perfect sense, with small sample size, there is a bigger
: probability (p-value) that your
: sample mean is 3.0 while the the real mean (H0) is 2.9, with bigger sample
: size (hence greater power),
: this probability drops, so you reject the null hypothesis(mu=2.9), which
: reflects the truth, the mean is
: 3.0, not 2.9. In this case the null hypothesis should be rejected, it's
: just with a big sample size you are
: more confident to reject the null while with small sample size you are not
: so
g*t
50 楼
偶然看到的一篇关于标准统计方法缺陷的文章,有兴趣的看一下:
http://life.bio.sunysb.edu/~massimo/lab/Lab_files/null%20hypotheses.pdf
http://life.bio.sunysb.edu/~massimo/lab/Lab_files/null%20hypotheses.pdf
相关阅读
历年诺贝尔物理学奖中EE相关的成果上交数字电视图像通信张文军的组已经发了近百篇IEEE Transcatio有没有好的线性电路实验书?一个实际数据分析的问题还是工作的问题,ee哪个方向在美国好找工作啊Scientific Peer Review (转载)哪个方向好?谢谢因为电压不同,美国电器在中国使用有问题吗?求书:有达人有这两本电子书吗?谁能给提供一个三维蚀刻仿真数据文件VR一般用什么驱动大牛给解释一下当前的语音识别技术吧?有去Milcom09的吗?share hotel?关于多层板多个ground plane的问题即将去高通总部面试,诚恳求建议关于IEEE Senior Member做RFID的软件部分好找工作吗?外行弱问:IEEE life fellow 是不是很难获得的?Linux上用什么工具标注jpg文件?function generator