E*e
2 楼
我利用空余时间做了下risk modeling。 之所以做,就是想用来构成投资建议。 比如
,开个户, 然后用自己的模型来选notes。
lending club的noets 有22% default rate,挺高的啊。 自己的模型能到AUC 0.702,
就是最简单的logistic regression。 random forest 和boosting 要低点。当然这个
跟没有细调参数有关。 不过还是想用logistic regression, 其他的方法只是作为个
参考。
同时也试着做了个kaggle的give me some credit。 目前logistic regression 可以到
0.8602. 这个比最好的0.8637要低点。 不够考虑模型的简单性, 结果也不错,对吧。
一个体会,就是数据预处理很重要。前段时间看到有人说道feature engineering,很
是赞同。简单处理数据,只能得到0.8, 但是用了feature engineering后就可以到0.
86.
开这个帖子就是想跟大家交流交流。 我在想lending club的数据是不是可以还能提高
点。 0.7不是很好, 最好可以上0.75. 那这样的预测才比较可靠。
谢谢。
,开个户, 然后用自己的模型来选notes。
lending club的noets 有22% default rate,挺高的啊。 自己的模型能到AUC 0.702,
就是最简单的logistic regression。 random forest 和boosting 要低点。当然这个
跟没有细调参数有关。 不过还是想用logistic regression, 其他的方法只是作为个
参考。
同时也试着做了个kaggle的give me some credit。 目前logistic regression 可以到
0.8602. 这个比最好的0.8637要低点。 不够考虑模型的简单性, 结果也不错,对吧。
一个体会,就是数据预处理很重要。前段时间看到有人说道feature engineering,很
是赞同。简单处理数据,只能得到0.8, 但是用了feature engineering后就可以到0.
86.
开这个帖子就是想跟大家交流交流。 我在想lending club的数据是不是可以还能提高
点。 0.7不是很好, 最好可以上0.75. 那这样的预测才比较可靠。
谢谢。
s*r
3 楼
HW,TIFFANY
或是定制一枚最实惠
或是定制一枚最实惠
l*j
4 楼
关于evaluation,想知道这个model的target variable是啥,是一个分类问题,还是
regression?比如是预测default rate还是收益啥的。
那么相应的选什么作为metrics就很重要,比如AUC、GINI、F1等
再就是是不是balance的,如果0 1分类中1只占1%,那么很高的AUC也不一定说明这个
model值得信赖,比如全都标成0.
这个项目还是很值得一做的,要相信,lending club的model也是他们的model团队搞出
来的,要有信心赛过他们
regression?比如是预测default rate还是收益啥的。
那么相应的选什么作为metrics就很重要,比如AUC、GINI、F1等
再就是是不是balance的,如果0 1分类中1只占1%,那么很高的AUC也不一定说明这个
model值得信赖,比如全都标成0.
这个项目还是很值得一做的,要相信,lending club的model也是他们的model团队搞出
来的,要有信心赛过他们
E*e
5 楼
这是一个regression 问题, 预测的是default概率。 22%的default rate 是从loan的
历史数据里得到的charge off 的百分比。 也就是说10个人里,最终有2个人charge
off。 考虑到note是收的利息是10-20%( 得比信用卡低个5-10%吧).22%的charge off
还是比较高的。 最近lending club 又提高了利息。
risk modeling 吧,还是AUC比较常用。 说实话, 没有一个metric 能适用普遍情况。
【在 l***j 的大作中提到】
: 关于evaluation,想知道这个model的target variable是啥,是一个分类问题,还是
: regression?比如是预测default rate还是收益啥的。
: 那么相应的选什么作为metrics就很重要,比如AUC、GINI、F1等
: 再就是是不是balance的,如果0 1分类中1只占1%,那么很高的AUC也不一定说明这个
: model值得信赖,比如全都标成0.
: 这个项目还是很值得一做的,要相信,lending club的model也是他们的model团队搞出
: 来的,要有信心赛过他们
历史数据里得到的charge off 的百分比。 也就是说10个人里,最终有2个人charge
off。 考虑到note是收的利息是10-20%( 得比信用卡低个5-10%吧).22%的charge off
还是比较高的。 最近lending club 又提高了利息。
risk modeling 吧,还是AUC比较常用。 说实话, 没有一个metric 能适用普遍情况。
【在 l***j 的大作中提到】
: 关于evaluation,想知道这个model的target variable是啥,是一个分类问题,还是
: regression?比如是预测default rate还是收益啥的。
: 那么相应的选什么作为metrics就很重要,比如AUC、GINI、F1等
: 再就是是不是balance的,如果0 1分类中1只占1%,那么很高的AUC也不一定说明这个
: model值得信赖,比如全都标成0.
: 这个项目还是很值得一做的,要相信,lending club的model也是他们的model团队搞出
: 来的,要有信心赛过他们
l*n
6 楼
不知道你们注意到lc的collection charge没有,30%。我都怀疑lc会不会作假骗钱。最
简单的就是找人贷款,比如36个月,第二年开始不付钱,然后lc collect,最后lc和申
请贷款的分那30%collection charge.
off
。
【在 E**********e 的大作中提到】
: 这是一个regression 问题, 预测的是default概率。 22%的default rate 是从loan的
: 历史数据里得到的charge off 的百分比。 也就是说10个人里,最终有2个人charge
: off。 考虑到note是收的利息是10-20%( 得比信用卡低个5-10%吧).22%的charge off
: 还是比较高的。 最近lending club 又提高了利息。
: risk modeling 吧,还是AUC比较常用。 说实话, 没有一个metric 能适用普遍情况。
简单的就是找人贷款,比如36个月,第二年开始不付钱,然后lc collect,最后lc和申
请贷款的分那30%collection charge.
off
。
【在 E**********e 的大作中提到】
: 这是一个regression 问题, 预测的是default概率。 22%的default rate 是从loan的
: 历史数据里得到的charge off 的百分比。 也就是说10个人里,最终有2个人charge
: off。 考虑到note是收的利息是10-20%( 得比信用卡低个5-10%吧).22%的charge off
: 还是比较高的。 最近lending club 又提高了利息。
: risk modeling 吧,还是AUC比较常用。 说实话, 没有一个metric 能适用普遍情况。
E*e
7 楼
这个不会吧。要是真的,那要出大事情的。
:不知道你们注意到lc的collection charge没有,30%。我都怀疑lc会不会作假骗钱。
最简单的就是找人贷款,比如36个月,第二年开始不付钱,然后lc collect,最后lc和
申请贷款的分那30%collection charge.
:
:不知道你们注意到lc的collection charge没有,30%。我都怀疑lc会不会作假骗钱。
最简单的就是找人贷款,比如36个月,第二年开始不付钱,然后lc collect,最后lc和
申请贷款的分那30%collection charge.
:
相关阅读
如何把1个文件分成22个以chromosone为单位的文件fresh graduate转行找工作历程 (转载)分享个MIT big data 的slides,对新手很有帮助-已更新下载报面筋求实习合租 (转载)Coursera Names Former Yale President as Its New CEO请教一个计算问题,谢谢 (转载)求教如何从网页抓取数据@@数据库大牛请进来,我应该选择一个怎样的数据库? @@data scientist考coding的题目可以用python吗?有DS的recuritor推荐吗offer 选择 quant developer 对比 data engineer / data scientist求克劳迪亚的Introduction to Data Science: Building Recommender Systems[Data Science Project Case] Fuzzy matching on names学习Pig LatinKaggle四月一号的题The Random Number Grand Challenge太搞笑了申请版副,请大家支持公司招DATA SCIENTIST新人求推荐,可穿戴设备相关的数据分析职位老帮菜怎么转ds?Big data是下一个大坑吗