g*u
2 楼
需要保持不同类别训练样本数目 balanced吗? 还是无所谓?
thx
thx
M*0
4 楼
1. 调参
http://xgboost.readthedocs.io/en/latest/how_to/param_tuning.html
2. 对数据up/down-sampling进行预处理
http://xgboost.readthedocs.io/en/latest/how_to/param_tuning.html
2. 对数据up/down-sampling进行预处理
m*r
5 楼
response rate 就算很低, 比如1% 我觉着做不做平衡问题不大。 你做了平衡, 虽说
可以增加一些性能, 比如敏感度。 但根客户解释起来,比较困难。 比如average
response rate 是一个百分点, 某客户得分百分之二或者千分之八, 市场部的大妈
可以马上做决定。
如果你搞平衡了,各打五十大板以后,同样的客户得分.85, 你让市场部大妈怎么做决
定呢?
可以增加一些性能, 比如敏感度。 但根客户解释起来,比较困难。 比如average
response rate 是一个百分点, 某客户得分百分之二或者千分之八, 市场部的大妈
可以马上做决定。
如果你搞平衡了,各打五十大板以后,同样的客户得分.85, 你让市场部大妈怎么做决
定呢?
相关阅读