l*a
2 楼
【 以下文字转载自 Statistics 讨论区 】
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 如果你不是孬种数学背景的统计学家,请接受挑战
发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱,我想请seattleren, ningyan, kaleege等人接受我的挑战。当然,我也欢
迎任何人参与严肃的讨论。不能说出个一二三四的,就请自动回避,免得自讨没趣(我
想对pp65说的是,我对你感到抱歉,因为本段最后的话对你来说说得太晚了)。
给定一个两分法的样本(假定X是自变量而Y是因变量,两段都是简单线性模型,且临界
点是在X上)。现行算法及分段模型组的基本表述如下:
hat\y_1 = a1+b1X if X<=t
hat\y_2 = a2+b2X if X>t
ID X Y M CR
1 x1 y1 m1 cr1
2 x2 y2 m2 cr2
3 x3 y3 m3 cr3
4 x4 y4 m4 cr4
5 x5 y5 m5 cr5
6 x6 y6 m6 cr6
7 x7 y7 m7* cr7 min(.)
8 x8 y8 m8 cr8
9 x9 y9 m9 cr9
0 x0 y0 m0 cr0
其中,M是由分段模型组的系数构成的矩阵,CR是分段模型的合并残差。*表示根据最小
CR选定的分段模型,如果我们有 min(CR)=cr7。
在得到m7后,按照强制连续性假设,对分段模型组7解联立方程组得到关于X上的一个解
Gamma
Gamma = (a1-a2)/(b2-b1) (1)
作为临界点t在样本基础上估计的结果。到此为止就是经典的分段回归分析(classical
piecewise regression or segmented regression)。后来,为了满足模型间连接的平
滑性,人们对连接点处进行了平滑处理,得到了一个现代化的样条模型。这就是现行的
分段回归。这个方法从数学的角度非常的正确,无懈可击。
然而,这样得到的临界点仅仅是一个随机的点测量,没有可信区间,在统计学上根本站
不住脚。尽管后来有人为此付出了努力,但基本上都失败了。直到bootstrap方法出来
后,人们才开始用bootstrap来构建临界点的可信区间。
上述基本分析逻辑构成了现当代统计学领域一个非常重要的基础部分,即最优化和强制
连续性。它们被广泛地使用在很多方法论的构建之中,例如生存分析中的比例风险模型
就是以最大似然估计为准则选定的模型。
现在,我对上述分析逻辑提出了批判。认为它在统计学理论上是一个错误。我的观点是
,首先,临界点在抽样条件下是一个随机变量,两段模型间是否连续是不确定的。它们
在抽样条件下一定存在一个连接变异。这个变异有多大多小谁也不知道,因而需要一个
概率进行推断而不是强制性地主观假设它们之间是exactly连续的。从而,用解联立方
程组估计临界点的方法根本行不通。其次,由于X是随机变量,分段模型组的系数矩阵M
以及合并残差CR在搜索过程中也将是一个随机变量,而且X、M和CR之间相互关联。它们
的随机点测量之间的对应是一个随机对应,从而不能由min(CR)来决定E(M)。最后,在
公式(1)中,Gamma具有不可测的变异性,因为分母(b2-b1)可以趋于甚至等于0。因
此,我对上述方法进行了如下改造:
hat\y_1 = a1+b1X if X<=t_bar (t: Threshold)
hat\y_2 = a2+b2X if X>=t_bar
ID X=T Y R M CR CRR=W
1 x1=t1 y1 r m1 cr1 w1=|r-cr1|/r
2 x2=t2 y2 r m2 cr2 w2=|r-cr2|/r
3 x3=t3 y3 r m3 cr3 w3=|r-cr3|/r
4 x4=t4 y4 r m4 cr4 w4=|r-cr4|/r
5 x5=t5 y5 r m5 cr5 w5=|r-cr5|/r
6 x6=t6 y6 r m6 cr6 w6=|r-cr6|/r
7 x7=t7 y7 r m7 cr7 w7=|r-cr7|/r
8 x8=t8 y8 r m8 cr8 w8=|r-cr8|/r
9 x9=t9 y9 r m9 cr9 w9=|r-cr9|/r
0 x0=t0 y0 r m0 cr0 w0=|r-cr0|/r
这里,R是全域模型的预测残差,根据模型的假定它是一个随机常量(因为样本因而模
型都是随机的,但对于给定的样本和模型来说,R是不变的)。由于临界点被假定在X上
,因而它与X拥有同一个可测空间。在两分法中,对X的每个实测样本点就是随机临界点
的实测样本点。这个搜索过程就是在假定每个实测X点作为临界点时对临界关系的改变
的意义或贡献是怎样的,这由CRR来度量。由于我们不知道临界点在哪里,只能这样假
设并搜索,从而得知每个点都有贡献,因此,由一个简单的加权平均估计就可以得到临
界点的期望估计。由此,临界模型就被建立在这个期望临界点之上,由此,两段模型间
的连接变异就可以在该期望临界点处得到测量,从而有了连续性检验的基础。由于有了
权重,我们可以计算临界点的加权抽样误差,从而可以计算其可信区间。而分段模型在
临界点处的CRR就是比较分段模型与全域模型之间的优劣的一个度量。
由于全域模型已经给定了全空间的基本关系型或模型结构,因此,在搜索临界点的过程
中,每次迭代的分段模型都应该与全域模型保持同一模型结构,从而CR就是一个单纯依
从系数的随机改变而改变的随机变量,因而它们之间的误差仅有抽样误差而没有系统误
差。
然而,两分法是一个特例,即其中的临界点数被arbitarily假定为只有一个。在我看来
,即使是临界点数也是不确定的。如果存在一个,是否存在另一个与它一致或不一致呢
?从而三分法的思想就诞生了。为了找到另一个,我构建了两类三分迭代法(对称的和
非对称的)以便为每个临界点构造一个可测空间,并由此得到对它以及它的权重的随机
测量,进而将每个临界点的估计建立在加权平均上。由于每个临界点都有加权的抽样误
差估计,因而采用一个加权的t-检验就可以推断两个临界点是否一致。从而一个样本空
间里的临界点的个数也在概率论上找到了支持。
请问,我的分析逻辑和算法错在哪?显然,任何一个受过统计学常识训练的人都会赞成
这个分析逻辑和算法。现在,请你们回答以下几个问题:
1)X, M, R, CR以及CRR等是否是随机变量?
2)min(CR)与m7之间的对应是一个随机对应还是一个期望对应?
3)我们可否用最优化来决定临界模型的期望?换句话说,对应于min(CR)的临界模型是
稳定的因而是可以被期望的模型吗?
4)所谓的“概率收敛”在CR上会收敛到min(CR)处吗?
如果你不是傻瓜,你一定会做出回答。
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 如果你不是孬种数学背景的统计学家,请接受挑战
发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱,我想请seattleren, ningyan, kaleege等人接受我的挑战。当然,我也欢
迎任何人参与严肃的讨论。不能说出个一二三四的,就请自动回避,免得自讨没趣(我
想对pp65说的是,我对你感到抱歉,因为本段最后的话对你来说说得太晚了)。
给定一个两分法的样本(假定X是自变量而Y是因变量,两段都是简单线性模型,且临界
点是在X上)。现行算法及分段模型组的基本表述如下:
hat\y_1 = a1+b1X if X<=t
hat\y_2 = a2+b2X if X>t
ID X Y M CR
1 x1 y1 m1 cr1
2 x2 y2 m2 cr2
3 x3 y3 m3 cr3
4 x4 y4 m4 cr4
5 x5 y5 m5 cr5
6 x6 y6 m6 cr6
7 x7 y7 m7* cr7 min(.)
8 x8 y8 m8 cr8
9 x9 y9 m9 cr9
0 x0 y0 m0 cr0
其中,M是由分段模型组的系数构成的矩阵,CR是分段模型的合并残差。*表示根据最小
CR选定的分段模型,如果我们有 min(CR)=cr7。
在得到m7后,按照强制连续性假设,对分段模型组7解联立方程组得到关于X上的一个解
Gamma
Gamma = (a1-a2)/(b2-b1) (1)
作为临界点t在样本基础上估计的结果。到此为止就是经典的分段回归分析(classical
piecewise regression or segmented regression)。后来,为了满足模型间连接的平
滑性,人们对连接点处进行了平滑处理,得到了一个现代化的样条模型。这就是现行的
分段回归。这个方法从数学的角度非常的正确,无懈可击。
然而,这样得到的临界点仅仅是一个随机的点测量,没有可信区间,在统计学上根本站
不住脚。尽管后来有人为此付出了努力,但基本上都失败了。直到bootstrap方法出来
后,人们才开始用bootstrap来构建临界点的可信区间。
上述基本分析逻辑构成了现当代统计学领域一个非常重要的基础部分,即最优化和强制
连续性。它们被广泛地使用在很多方法论的构建之中,例如生存分析中的比例风险模型
就是以最大似然估计为准则选定的模型。
现在,我对上述分析逻辑提出了批判。认为它在统计学理论上是一个错误。我的观点是
,首先,临界点在抽样条件下是一个随机变量,两段模型间是否连续是不确定的。它们
在抽样条件下一定存在一个连接变异。这个变异有多大多小谁也不知道,因而需要一个
概率进行推断而不是强制性地主观假设它们之间是exactly连续的。从而,用解联立方
程组估计临界点的方法根本行不通。其次,由于X是随机变量,分段模型组的系数矩阵M
以及合并残差CR在搜索过程中也将是一个随机变量,而且X、M和CR之间相互关联。它们
的随机点测量之间的对应是一个随机对应,从而不能由min(CR)来决定E(M)。最后,在
公式(1)中,Gamma具有不可测的变异性,因为分母(b2-b1)可以趋于甚至等于0。因
此,我对上述方法进行了如下改造:
hat\y_1 = a1+b1X if X<=t_bar (t: Threshold)
hat\y_2 = a2+b2X if X>=t_bar
ID X=T Y R M CR CRR=W
1 x1=t1 y1 r m1 cr1 w1=|r-cr1|/r
2 x2=t2 y2 r m2 cr2 w2=|r-cr2|/r
3 x3=t3 y3 r m3 cr3 w3=|r-cr3|/r
4 x4=t4 y4 r m4 cr4 w4=|r-cr4|/r
5 x5=t5 y5 r m5 cr5 w5=|r-cr5|/r
6 x6=t6 y6 r m6 cr6 w6=|r-cr6|/r
7 x7=t7 y7 r m7 cr7 w7=|r-cr7|/r
8 x8=t8 y8 r m8 cr8 w8=|r-cr8|/r
9 x9=t9 y9 r m9 cr9 w9=|r-cr9|/r
0 x0=t0 y0 r m0 cr0 w0=|r-cr0|/r
这里,R是全域模型的预测残差,根据模型的假定它是一个随机常量(因为样本因而模
型都是随机的,但对于给定的样本和模型来说,R是不变的)。由于临界点被假定在X上
,因而它与X拥有同一个可测空间。在两分法中,对X的每个实测样本点就是随机临界点
的实测样本点。这个搜索过程就是在假定每个实测X点作为临界点时对临界关系的改变
的意义或贡献是怎样的,这由CRR来度量。由于我们不知道临界点在哪里,只能这样假
设并搜索,从而得知每个点都有贡献,因此,由一个简单的加权平均估计就可以得到临
界点的期望估计。由此,临界模型就被建立在这个期望临界点之上,由此,两段模型间
的连接变异就可以在该期望临界点处得到测量,从而有了连续性检验的基础。由于有了
权重,我们可以计算临界点的加权抽样误差,从而可以计算其可信区间。而分段模型在
临界点处的CRR就是比较分段模型与全域模型之间的优劣的一个度量。
由于全域模型已经给定了全空间的基本关系型或模型结构,因此,在搜索临界点的过程
中,每次迭代的分段模型都应该与全域模型保持同一模型结构,从而CR就是一个单纯依
从系数的随机改变而改变的随机变量,因而它们之间的误差仅有抽样误差而没有系统误
差。
然而,两分法是一个特例,即其中的临界点数被arbitarily假定为只有一个。在我看来
,即使是临界点数也是不确定的。如果存在一个,是否存在另一个与它一致或不一致呢
?从而三分法的思想就诞生了。为了找到另一个,我构建了两类三分迭代法(对称的和
非对称的)以便为每个临界点构造一个可测空间,并由此得到对它以及它的权重的随机
测量,进而将每个临界点的估计建立在加权平均上。由于每个临界点都有加权的抽样误
差估计,因而采用一个加权的t-检验就可以推断两个临界点是否一致。从而一个样本空
间里的临界点的个数也在概率论上找到了支持。
请问,我的分析逻辑和算法错在哪?显然,任何一个受过统计学常识训练的人都会赞成
这个分析逻辑和算法。现在,请你们回答以下几个问题:
1)X, M, R, CR以及CRR等是否是随机变量?
2)min(CR)与m7之间的对应是一个随机对应还是一个期望对应?
3)我们可否用最优化来决定临界模型的期望?换句话说,对应于min(CR)的临界模型是
稳定的因而是可以被期望的模型吗?
4)所谓的“概率收敛”在CR上会收敛到min(CR)处吗?
如果你不是傻瓜,你一定会做出回答。
x5
3 楼
摘要?
学里
也欢
【在 l***a 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: TNEGIETNI (lovewisdom), 信区: Statistics
: 标 题: 如果你不是孬种数学背景的统计学家,请接受挑战
: 发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
: 这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
: 握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
: ,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
: 去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
: 续为版上添乱,我想请seattleren, ningyan, kaleege等人接受我的挑战。当然,我也欢
: 迎任何人参与严肃的讨论。不能说出个一二三四的,就请自动回避,免得自讨没趣(我
学里
也欢
【在 l***a 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: TNEGIETNI (lovewisdom), 信区: Statistics
: 标 题: 如果你不是孬种数学背景的统计学家,请接受挑战
: 发信站: BBS 未名空间站 (Fri May 13 12:13:47 2011, 美东)
: 这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
: 握了一点数学技能就在统计学里自命不凡。如果他们不是孬种,就请接受我的以下挑战
: ,并回答我在最后提出的简单问题。回答不了的,或不敢回答的,就请他/她滚回数学里
: 去讨饭吃,别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
: 续为版上添乱,我想请seattleren, ningyan, kaleege等人接受我的挑战。当然,我也欢
: 迎任何人参与严肃的讨论。不能说出个一二三四的,就请自动回避,免得自讨没趣(我
h*e
6 楼
也曾临时客串过佛投机的宠物吧。
相关阅读
要不要把DELL 4K显示器退了...[WTB] Sony FE 55 f/1.8 ZA求问 16-35 有没有deal啊被人批评总是跟大家吵架了刚买6D,推荐背包Nikon 全副35/1.8G ED评测全幅广角上哪个?1740,1635还是24L?NAB都开了好几天了,观音的新机器呢?这个Amazon机顶盒会HOT么?北京街头美女[zz]进入4月,实拍于北京街头 (转载)如果开了防抖,是不是ai servo af 就不工作求推荐微单相机包(Fuji XE2 with 18-55mm lens)笑趴了p+这是要逆潮流而动阿这是摄影不要命的——近距离接触巨型水蟒第11-16卷,贴几张今天晚上婚礼这仁兄唱歌真好听失眠啊,4点玩ipad到现在丐帮的deal来了