Redian新闻
>
请问xgboost训练需要保持不同类别样本数尽量一致吗?
avatar
请问xgboost训练需要保持不同类别样本数尽量一致吗?# Programming - 葵花宝典
k*a
1
他好像大学本来学的编剧,并非导演。
avatar
g*u
2
需要保持不同类别训练样本数目 balanced吗? 还是无所谓?
thx
avatar
N*r
3

xgboost内部有对样本的平衡
但每种样本不能太少,至少得到统计显著吧

【在 g*******u 的大作中提到】
: 需要保持不同类别训练样本数目 balanced吗? 还是无所谓?
: thx

avatar
m*r
5
response rate 就算很低, 比如1% 我觉着做不做平衡问题不大。 你做了平衡, 虽说
可以增加一些性能, 比如敏感度。 但根客户解释起来,比较困难。 比如average
response rate 是一个百分点, 某客户得分百分之二或者千分之八, 市场部的大妈
可以马上做决定。
如果你搞平衡了,各打五十大板以后,同样的客户得分.85, 你让市场部大妈怎么做决
定呢?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。