【 以下文字转载自 Statistics 讨论区 】
发信人: TNEGIETNI (lovewisdom), 信区: Statistics
标 题: 临界回归模型的连续性
发信站: BBS 未名空间站 (Sat May 14 19:04:31 2011, 美东)
Continuity of Threshold Regression Model
我做了一个图来说明统计学中分段回归模型的连续性与数学中分段函数的连续性的区别。
说明一下:图中的临界点被假设并估计在X上(Threshold on X),它是在全样本空间
里进行迭代搜索(即每假设X的一个随机实测点为可能的临界点时就得到一对分段模型
,当样本量为n时,就有n对随机临界模型,每对临界模型都有一个合并的预测残差的
期望估计量)的基础上以分段模型的合并残差期望对全域模型的残差期望的相对改变为
权重而计算出来的X上的一个加权期望。所以,两个分段模型间不是exactly连
接在一起的。
我的问题是,这两个分段模型间是连续的还是离断的?为什么?(问题上站几个小时了
也没人愿意回答。还是让我自己回答好了:从统计的随机变异角度看,我们没法假设两
段模型间是连续的,两者间必有一个随机的连接变异存在,从而也就不能用解联立方程
的办法来估计临界点。为了知道两段模型是否连续,我们需要一个概率推断,即推断那
个随机的连接变异在本次抽样中作为随机误差发生的大小。这个变异在样本空间上发生
概率的大小可以用来估计其抽样误差发生的大小。这就是连续性检验的基本逻辑。)
估计我在这个样本空间里放置一个fullwise直线模型会令所有人感到不快,因为空间里
的关系显然不是直线似的,而是二次或三次多项式的关系。如果有人问这个放置背后的
逻辑是什么,我会告诉他/她,这就是辩证逻辑。
借此机会简单介绍一下自己在统计学里所做的工作:我所做的工作与概率论的关系不太
大(除了分段模型的连续性检验、分段模型间的差异性检验需要构造检验统计量以便进
行概率推断外)。主要是设计了一套分段回归分析的逻辑,以及两类三分迭代法。这都
是不需要任何数学知识的工作。另外就是对统计学里的一些问题进行了深度的哲学思考,
提出自权重的构造逻辑和统计算法。这也是不需要概率论支持的,只须简单的数学四则
运算技能。这种技能小学生就具备了。