g*u
2 楼
需要保持不同类别训练样本数目 balanced吗? 还是无所谓?
thx
thx
M*0
4 楼
1. 调参
http://xgboost.readthedocs.io/en/latest/how_to/param_tuning.html
2. 对数据up/down-sampling进行预处理
http://xgboost.readthedocs.io/en/latest/how_to/param_tuning.html
2. 对数据up/down-sampling进行预处理
m*r
5 楼
response rate 就算很低, 比如1% 我觉着做不做平衡问题不大。 你做了平衡, 虽说
可以增加一些性能, 比如敏感度。 但根客户解释起来,比较困难。 比如average
response rate 是一个百分点, 某客户得分百分之二或者千分之八, 市场部的大妈
可以马上做决定。
如果你搞平衡了,各打五十大板以后,同样的客户得分.85, 你让市场部大妈怎么做决
定呢?
可以增加一些性能, 比如敏感度。 但根客户解释起来,比较困难。 比如average
response rate 是一个百分点, 某客户得分百分之二或者千分之八, 市场部的大妈
可以马上做决定。
如果你搞平衡了,各打五十大板以后,同样的客户得分.85, 你让市场部大妈怎么做决
定呢?
相关阅读
Spa这东西不适合所有场景吧?问个弱智问题,js除了前端和node.js这种framework,还能用在哪里?Microsoft forges ahead with 'Prajna' big-data analytics fr感觉vertx越来越火了?这个版上的主要矛盾有人试了bootstrap4了没我来说说为什么女人大部分不适合CS吧如何找Clojure工作对分布式软件的Jepsen测试古德霸别骂架了 给新人指点指点学啥技术吧Hibernate值得深入学习吗?goodbug,魏老师都是做distributed database/system的。socket.io doesn't work with IE菜鸟也玩数据库为什么会有这么多的effective xxxandroid怎么用java啊Consistency做好了不容易明天大家都去C* summit么?前微软老员工讲为什么 bing 不如 googlego 不remove pointer 永远也没法取代python