g*t
2 楼
https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
前段时间有人问这个问题吧。这个贴还不错
www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
前段时间有人问这个问题吧。这个贴还不错
j*l
3 楼
我给你邮费 转给我吧。。
我自己用
atd兄弟如果没货的话
我自己用
atd兄弟如果没货的话
L*8
4 楼
https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
1. Use the right evaluation metrics
大家都不及格 所以修改成绩计算方式
2. Resample the training set
如果是用原来的数据,屁用没有
如果是产生新数据 那就是废话
3. Use K-fold Cross-Validation in the right way
没啥关系
4. Ensemble different resampled datasets
有点意思
5. Resample with different ratios
根4没啥大区别
6. Cluster the abundant class
对特定数据可能有效
但是没有充分利用数据
7. Design your own models
说的就是class weight和cost function
【在 g****t 的大作中提到】
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 前段时间有人问这个问题吧。这个贴还不错
1. Use the right evaluation metrics
大家都不及格 所以修改成绩计算方式
2. Resample the training set
如果是用原来的数据,屁用没有
如果是产生新数据 那就是废话
3. Use K-fold Cross-Validation in the right way
没啥关系
4. Ensemble different resampled datasets
有点意思
5. Resample with different ratios
根4没啥大区别
6. Cluster the abundant class
对特定数据可能有效
但是没有充分利用数据
7. Design your own models
说的就是class weight和cost function
【在 g****t 的大作中提到】
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 前段时间有人问这个问题吧。这个贴还不错
L*8
6 楼
svm one class classification 这个思路其实很有意思
就是关注一个类的内部特征
【在 L****8 的大作中提到】
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 1. Use the right evaluation metrics
: 大家都不及格 所以修改成绩计算方式
: 2. Resample the training set
: 如果是用原来的数据,屁用没有
: 如果是产生新数据 那就是废话
: 3. Use K-fold Cross-Validation in the right way
: 没啥关系
: 4. Ensemble different resampled datasets
: 有点意思
就是关注一个类的内部特征
【在 L****8 的大作中提到】
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 1. Use the right evaluation metrics
: 大家都不及格 所以修改成绩计算方式
: 2. Resample the training set
: 如果是用原来的数据,屁用没有
: 如果是产生新数据 那就是废话
: 3. Use K-fold Cross-Validation in the right way
: 没啥关系
: 4. Ensemble different resampled datasets
: 有点意思
m*o
10 楼
比较靠谱的办法是用decoder encoder的办法使用unlabeled data预先训练神经网络。
相关阅读
[合集] brain teaser有没有玩CUDA的?[合集] 问个题--- web dynamic graphic generation哪位在Linux上用C++碰到过memory fragmentation吗?the practice of programming有必要学一学MFC吗?how to find the smallest matching pattern in Lex有没有非触摸的,基于红外跟踪,象WII 一样的鼠标? (转载)java error 新手问题, 请帮忙看看请问这个面试题想考啥啊?[合集] 弱问:C++ 里的Vector在Java里用什么替代比较好?[合集] What is wrong? Urgent help needed.请教C#程序反编译问题[合集] 请教一个面试题 (转载)C++有没有什么好点的数据库客户端library请版上的C++牛人讲一下g++的优化参数[合集] 请问哪位有Hilbert transform 的 C codehow to convert str to double[合集] perl symbol tables 一问[合集] 谭浩强的那本C++的书怎样?C++初学书哪本最好?