这里牛人多,有个旧车配件估计问题请教一下。
大概有1000辆不同model车的信息,大概10个model左右吧。
每辆车有旧车售出价格,年份,mileage,color,还有所有安装的配件,诸如moonroof
,navigation,upgraded engine, ungraded trim, 等等几十项。
需要估计每种旧配件的价格,比如说moonroof,2年新,3万mile,价格是400, 1年新
,1万mile,价格是600。
该怎么做呢?
我的想法是:
A。 简单点的
干脆就来个linear (option都是1 / 0, color) +logistic (year, mileage)
mix regression
问题是,park的折旧应该是车原价,年份,mileage的函数。
B。 更复杂的
1 不考虑配件,某车型base model的折旧价应该是Original Price X F(age,
mileage),F是折旧function
折旧function可以用age,mileage的简单函数近似(例如 1 - a × age - b x
sqrt (mileage))
不同车型的折旧function的参数可能不一样, 可能和original price有关,可能和
车型(sedan, couple, wegan, SUV, truck)有关
2 配件折旧价
每个配件也可以象上面车型这么搞,可是这样话,参数太多,数据点太少。
所以考虑每种配件设一个(最多两个)参数了事。
例如折扣指数
假如车价折旧率是40%(原价50k,折旧价30k),
某配件折旧率是60%,指数就是1.8 ( (1-0.4) ^ 1.8 = (1-0.6)
某配件折旧率是30%, 指数就是0.7 ( (1-0.4) ^ 0.7 = (1-0.7)
如果照这种法子,应该用啥model来算参数啊?
有没有其他建议?
多谢了。