Redian新闻
>
求handle missing data的好方法
avatar
求handle missing data的好方法# DataSciences - 数据科学
m*y
1
初学ML,感觉很多data set处理起来的时候都要考虑如何handle missing attribute,
想问问版上大牛一般是怎么处理的,有没有好的paper或文档推荐? 我查到的方法:1
)fill with mean/median 2) build model to predict missing value, like KNN or
any predictive modeling method, 3) 想不出来了。。 希望版上牛牛多多回复。
avatar
D*n
2
no good methods.

1
or

【在 m*****y 的大作中提到】
: 初学ML,感觉很多data set处理起来的时候都要考虑如何handle missing attribute,
: 想问问版上大牛一般是怎么处理的,有没有好的paper或文档推荐? 我查到的方法:1
: )fill with mean/median 2) build model to predict missing value, like KNN or
: any predictive modeling method, 3) 想不出来了。。 希望版上牛牛多多回复。

avatar
d*e
3
嗯,都是具体问题具体分析。

【在 D******n 的大作中提到】
: no good methods.
:
: 1
: or

avatar
T*u
4
missing data的原因是什么,有什么Impact
avatar
G*n
5
这个问题很难,没什么好的办法吧,如果miss太多直接把1行扔掉
avatar
r*t
6
missing rate太大基本没有好方法,很少的话可以直接listwise deletion,有一些而
且考虑estimation的话,可以考虑multiple imputation和full information maximum
likelihood estimation。当然这都是统计模型下的。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。