g*t
2 楼
https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
前段时间有人问这个问题吧。这个贴还不错
www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
前段时间有人问这个问题吧。这个贴还不错
j*l
3 楼
我给你邮费 转给我吧。。
我自己用
atd兄弟如果没货的话
我自己用
atd兄弟如果没货的话
L*8
4 楼
https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
1. Use the right evaluation metrics
大家都不及格 所以修改成绩计算方式
2. Resample the training set
如果是用原来的数据,屁用没有
如果是产生新数据 那就是废话
3. Use K-fold Cross-Validation in the right way
没啥关系
4. Ensemble different resampled datasets
有点意思
5. Resample with different ratios
根4没啥大区别
6. Cluster the abundant class
对特定数据可能有效
但是没有充分利用数据
7. Design your own models
说的就是class weight和cost function
【在 g****t 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 前段时间有人问这个问题吧。这个贴还不错
1. Use the right evaluation metrics
大家都不及格 所以修改成绩计算方式
2. Resample the training set
如果是用原来的数据,屁用没有
如果是产生新数据 那就是废话
3. Use K-fold Cross-Validation in the right way
没啥关系
4. Ensemble different resampled datasets
有点意思
5. Resample with different ratios
根4没啥大区别
6. Cluster the abundant class
对特定数据可能有效
但是没有充分利用数据
7. Design your own models
说的就是class weight和cost function
【在 g****t 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 前段时间有人问这个问题吧。这个贴还不错
L*8
6 楼
svm one class classification 这个思路其实很有意思
就是关注一个类的内部特征
【在 L****8 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 1. Use the right evaluation metrics
: 大家都不及格 所以修改成绩计算方式
: 2. Resample the training set
: 如果是用原来的数据,屁用没有
: 如果是产生新数据 那就是废话
: 3. Use K-fold Cross-Validation in the right way
: 没啥关系
: 4. Ensemble different resampled datasets
: 有点意思
就是关注一个类的内部特征
【在 L****8 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: https://www.kdnuggets.com/2017/06/7-techniques-handle-imbalanced-data.html
: 1. Use the right evaluation metrics
: 大家都不及格 所以修改成绩计算方式
: 2. Resample the training set
: 如果是用原来的数据,屁用没有
: 如果是产生新数据 那就是废话
: 3. Use K-fold Cross-Validation in the right way
: 没啥关系
: 4. Ensemble different resampled datasets
: 有点意思
m*o
10 楼
比较靠谱的办法是用decoder encoder的办法使用unlabeled data预先训练神经网络。
相关阅读
g++ command line一问码农如何接私活【C++算法求助】有个O(n*n)的算法不知道该怎么优化并且并行化计算advanced OS 和computer networks哪个对提高编程帮助更大?how printk works大牛对自动生成form有什么看法现在大学都开始教Scala了?学会任何编程语言只需高中毕业请教高手:Google云这个是如何实现的?今天听到一个笑话DigitalOcean $50 credit学FP不是为了写代码, 而是为了优秀的架构.支持我的JS OOP观点的文章来了牛人们都在这儿,问个问题吧编程技术与市场推广难易: 社交网, 云计算, 比特币(电子货币)java的hotspot,js的v8还有dart vm都出自一个人之手Python和perl都属于那种很难精通的语言一个SAS sql的问题我来挖坑, 谈谈OOP/FP/SQL和人类思维习惯Workflow design请教