7种处理不平衡数据的技术 ZT - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>Programming - 葵花宝典

7种处理不平衡数据的技术 ZT

7种处理不平衡数据的技术 ZT# Programming - 葵花宝典

z*a2018-04-20 07:04

1 楼

结果说you are lucky，建议不要cancel，再给$10ff

g*t2018-04-20 07:04

2 楼

https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
前段时间有人问这个问题吧。这个贴还不错

j*l2018-04-20 07:04

3 楼

我给你邮费转给我吧。。
我自己用
atd兄弟如果没货的话

L*82018-04-20 07:04

4 楼

https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
1. Use the right evaluation metrics
大家都不及格所以修改成绩计算方式
2. Resample the training set
如果是用原来的数据，屁用没有
如果是产生新数据那就是废话
3. Use K-fold Cross-Validation in the right way
没啥关系
4. Ensemble different resampled datasets
有点意思
5. Resample with different ratios
根4没啥大区别
6. Cluster the abundant class
对特定数据可能有效
但是没有充分利用数据
7. Design your own models
说的就是class weight和cost function

【在 g****t 的大作中提到】

: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 前段时间有人问这个问题吧。这个贴还不错

z*a2018-04-20 07:04

5 楼

已经cancel了。

【在 j*****l 的大作中提到】

: 我给你邮费转给我吧。。
: 我自己用
: atd兄弟如果没货的话

L*82018-04-20 07:04

6 楼

svm one class classification 这个思路其实很有意思
就是关注一个类的内部特征

【在 L****8 的大作中提到】

: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 1. Use the right evaluation metrics
: 大家都不及格所以修改成绩计算方式
: 2. Resample the training set
: 如果是用原来的数据，屁用没有
: 如果是产生新数据那就是废话
: 3. Use K-fold Cross-Validation in the right way
: 没啥关系
: 4. Ensemble different resampled datasets
: 有点意思