Redian新闻
>
计算 confidence interval 和 prediction interval的一般方法
avatar
计算 confidence interval 和 prediction interval的一般方法# DataSciences - 数据科学
a*e
1
针对一个数据集建立回归模型后,如何计算 confidence interval 和 prediction
interval. R 里的predict.lm 能够提供这两个指标。这只是针对线性回归的。 但还
有其他
general的模型比如 cart,gam.感觉这两个指标应该是基于bootstrap方法的,但没找
到相关文献。
avatar
m*a
2
大致作法应该是这样的
1. 你有一列数据点(y0, x0), 这里x应理解为N维矢量
你的模型是 y = f(x, c), c 是一列模型参数
在你建模型时, 你是要定出这一列参数 c, 同时你还应该得到对应的 Covariance
Matrix
通常的软件都提供这些信息
2. 有了Covariance Matrix后, 你可以生成很多列参数 c,
下面实际是作一些 Monte Carlo 模拟,
对应每一个数据点, 你都有很多 prediction - 因为每列c 给一个prediction
因此, 如果你有 D 个数据点的话,
你得到 D by D 的一个Covariance Matrix M -别和前面的Covariance Matrix混淆
3. 现在你可以算出来 Chi-Square
SUM( (y0 - y) M^-1 (y0 - y) )
同时, D 就是你的自由度数
有了这两个, 查表就知道你的 confidence level, 就是你的模型有多可靠
4. 关于你说的 confidence interval 和 prediction interval, 不是太清楚你想干吗,
感觉和第二步有关系, 因为对每一个数据点, 知道对应的模型预测值和相应的
ERROR, 所以你可以得到相应的confidence interval 和 prediction interval, 不知
到你是否需要考虑数据点本身的统计误差

【在 a********e 的大作中提到】
: 针对一个数据集建立回归模型后,如何计算 confidence interval 和 prediction
: interval. R 里的predict.lm 能够提供这两个指标。这只是针对线性回归的。 但还
: 有其他
: general的模型比如 cart,gam.感觉这两个指标应该是基于bootstrap方法的,但没找
: 到相关文献。

avatar
a*k
3
Refer to J. A. Rice's "Mathematical statistics and data analysis", Third
edition, Chapter 14.
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。