p value被摈弃了?如何算confidence interval之类的东西?# DataSciences - 数据科学
s*h
1 楼
偶尔看看版上贴的机器学习时报,大数据时报,多谢热情贴主阿。
有个问题就是内容都太新太高大上了,不接地气啊,呵呵。
难得有个接地气的,又不太搞得懂.
http://www.nature.com/news/scientific-method-statistical-errors
今天, 看到上面那个link讲p value的问题, 觉得有道理,可是又不明白到底是怎么回事
.那位统计大牛讲一讲?
我统计的东西懂得浅, 请教一下,这么一来,什么confidence interval啥的都不靠谱了?
regression里算出来的p value也不可靠?
举个例子, X ~ binomial分布 px.
10000个sample, sum = 2000, std = sqrt(10000 * 0.2 * 0.8) = 40
px值在( 2000 - 1.96 * 40 ~ 2000 + 1.96 * 40) 间的可能性是95%
如果有 Y ~ binomial分布 py, 10000个sample, sum = 1900.
有个公式算 px > py 的p value的,现在这个p value没用了?
那对于px, py, 除了mean值本身之外,它们之间的关系,我们能做出什么统计结论?
对了,比较搞笑的是有人说p value就是statistical hypothesis inference testing
简写就是。。。
有个问题就是内容都太新太高大上了,不接地气啊,呵呵。
难得有个接地气的,又不太搞得懂.
http://www.nature.com/news/scientific-method-statistical-errors
今天, 看到上面那个link讲p value的问题, 觉得有道理,可是又不明白到底是怎么回事
.那位统计大牛讲一讲?
我统计的东西懂得浅, 请教一下,这么一来,什么confidence interval啥的都不靠谱了?
regression里算出来的p value也不可靠?
举个例子, X ~ binomial分布 px.
10000个sample, sum = 2000, std = sqrt(10000 * 0.2 * 0.8) = 40
px值在( 2000 - 1.96 * 40 ~ 2000 + 1.96 * 40) 间的可能性是95%
如果有 Y ~ binomial分布 py, 10000个sample, sum = 1900.
有个公式算 px > py 的p value的,现在这个p value没用了?
那对于px, py, 除了mean值本身之外,它们之间的关系,我们能做出什么统计结论?
对了,比较搞笑的是有人说p value就是statistical hypothesis inference testing
简写就是。。。