Redian新闻
>
请教有没有用多个model来依次判断做classification的例子
avatar
请教有没有用多个model来依次判断做classification的例子# Programming - 葵花宝典
z*e
1
很奇怪好像版上没人谈过这个问题。
很多人不确定父母何时回去,所以想回程可变。通常这样的机票较贵,而且可变的时间
范围受限。
但又不能不买回程机票,否则父母在海关可能会受到麻烦。
所以可不可以买fully refundable的回程机票,就是用来让父母入关时候用的。一旦入
关了就cancel掉。有人说fully refundable的机票贵。但反正是要cancel,就算贵几千
刀又如何。
另外有人说买双程的比买两个单程的便宜很多。但是,如果是用里程数来买机票,就没
有区别了。2个单程和一个双程是一样的。
谁可以给一个确认?多谢。
avatar
i*e
2
不知道我的思路对不对
问题是这样:我的dataset里的response有两个,一个R1是从0-1的分布;另一个R2是切
割R1分了4个band:0 ->0; (0-0.3] -> 1; (0.3-0.8] -> 2; (0.8 - 1] -> 3. R1的分
布不太好,“0”很多,其他的是left-skewed分布。最终目标是model R2.
直接model R1, mean error 大概0.2, 但是model R2时 试了很多classifier 都在0.
6以上。我估计因为prediction的时候如果是0.1,虽然很接近实际值0,但是在R2分类
还是算1,导致error变大。
我琢磨能不能先用modelA判断是零还是其他,再用一次model判断是1,2,or3.
1. 这种用多次model分类的有好的例子借鉴吗
2. 不知道有没有其他的方法。
多谢!
avatar
z*e
3
顶一下。
avatar
x*i
4
听起来像ensemble 啊,这个应用很多了

:不知道我的思路对不对
:问题是这样:我的dataset里的response有两个,一个R1是从0-1的分布;另一个R2是
切割R1分了4个band:0 ->0; (0-0.3] -> 1; (0.3-0.8] -> 2; (0.8 - 1
] -> 3. R1的分布不太好,“0”很多,其他的是left-skewed分布。最终目标是
model R2.
avatar
b*3
5
你那个里程首先就不能想退就退,一般要交几百块钱的手续费。
avatar
f*r
6
你一开始predict R1是做regression,用mse来evaluate的话model对0到0.1的penalty
和0.1到0.2的penalty是一样的,但是你最终的目标是非均匀的区间,还包括一个0这样
的单独的数,所以先regression再map到R2多半不是最优的。
我建议直接对R2做classification,然后你提到很多都是0,那就需要做一些
imbalanced的trick,比如downsampling,或者给weighted cost matrix。
但是回到你这个问题本身,我比较好奇这个R1到R2的mapping是人为的吗?还是真的就
是真正的目标变量的物理定义。可以分享一下具体是啥课题吗?
avatar
z*e
7
买fully refundable的就用credit card买,到时候再退啊。

【在 b******3 的大作中提到】
: 你那个里程首先就不能想退就退,一般要交几百块钱的手续费。
avatar
m*o
8
我建议对目标值做一个boxplot,计算一下均值和中值。如果均值和中值都在比如说0.
01以下或者很大,你的regression model(R1)实际上效果就很差了。

0.

【在 i*******e 的大作中提到】
: 不知道我的思路对不对
: 问题是这样:我的dataset里的response有两个,一个R1是从0-1的分布;另一个R2是切
: 割R1分了4个band:0 ->0; (0-0.3] -> 1; (0.3-0.8] -> 2; (0.8 - 1] -> 3. R1的分
: 布不太好,“0”很多,其他的是left-skewed分布。最终目标是model R2.
: 直接model R1, mean error 大概0.2, 但是model R2时 试了很多classifier 都在0.
: 6以上。我估计因为prediction的时候如果是0.1,虽然很接近实际值0,但是在R2分类
: 还是算1,导致error变大。
: 我琢磨能不能先用modelA判断是零还是其他,再用一次model判断是1,2,or3.
: 1. 这种用多次model分类的有好的例子借鉴吗
: 2. 不知道有没有其他的方法。

avatar
y*2
9
来时候的机票已经用了,只能退返程的。
你自己看一下full-refundable 的价格,算一下,要是划算,你就买。自
己做做功课,一切就都清楚了。

【在 z****e 的大作中提到】
: 买fully refundable的就用credit card买,到时候再退啊。
avatar
i*e
10
谢谢各位回复
我同意对R1做regression可能是绕弯,R1 prediction再cut成R2 做出来error更大(>1
)。我之所以开始想R1也是搞R2时各种classifier的cross validation accuracy 都才0
.5左右,mean error差不多0.6. 我就琢磨能不能借助R1来train model。
对于数据分布我也提到是left-skewed的,所以0-0.5的数据很少,但是0很突兀很多。
现在的问题是怎么处理好“0”这个response。关于“weighted cost matrix”等
imbalance的方法有用在classification上的例子吗。谢谢了。
另外关于R1到R2确实是人为的,没有任何scientific的东西。怎么切也是可能是行规,
我估计更多的是给不懂science的比如搞business的给指导意见。
avatar
a*n
11
当然不能都买,分开买。来的时候和普通单程一样,只买返程全价可退票用来入关。
不过可以不可以退,是不是全退,我就不清楚了,呵呵。

【在 y******2 的大作中提到】
: 来时候的机票已经用了,只能退返程的。
: 你自己看一下full-refundable 的价格,算一下,要是划算,你就买。自
: 己做做功课,一切就都清楚了。

avatar
z*e
12
Checked UA.com found that it's fully refundable for "unrestricted fare"
tickets. Though it's a little expensive, it's FULLY refundable.

【在 a*****n 的大作中提到】
: 当然不能都买,分开买。来的时候和普通单程一样,只买返程全价可退票用来入关。
: 不过可以不可以退,是不是全退,我就不清楚了,呵呵。

avatar
l*y
13
可以啊
不过买两个单程经常也不便宜

【在 z****e 的大作中提到】
: Checked UA.com found that it's fully refundable for "unrestricted fare"
: tickets. Though it's a little expensive, it's FULLY refundable.

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。