l*r
2 楼
面试官说如果一个机器学习的model 过拟合了,要怎么改进,我想到了说 cross
validation再重新训练,感觉面试官很不满意,应该怎么改进呢?想不到其他方法了
validation再重新训练,感觉面试官很不满意,应该怎么改进呢?想不到其他方法了
c*7
3 楼
no good
d*o
5 楼
google lowest price * 60%,就有人收
c*7
7 楼
自己用吧,备份备份资料,利润太小了
o*4
8 楼
Split data 3 ways: train, eval, validation. Train & tune your model using
the validation set, and only use eval for evaluation, never tune parameters
on the eval set.
the validation set, and only use eval for evaluation, never tune parameters
on the eval set.
w*o
9 楼
出了六个,还有三个,谁要?
m*0
12 楼
regularization, bagging, early stopping, add more training data
l*i
13 楼
多少钱, 要一个自用。。
r*g
18 楼
我也全忘了 刚搜了一下
E(R(fn) - R(f)*) < O(sqrt(Vf) * sqrt(log(n)/(n)))
fn是有n个data时候你设计的classifior
V(f)是这个classifior的复杂度
R(fn)是risk, R(f)*是f类classifior的最优risk
他的期望的bound是随着sqrt(Vf)的增加而增加的
这就是理论上为什么不能把classifior的复杂度设置的太高的原因
因为你无法控制error的上限
【在 w********n 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: In practice, you can do anything about data when data is giving.
: You need to reduce the complexity of your model to overcome overfitting.
E(R(fn) - R(f)*) < O(sqrt(Vf) * sqrt(log(n)/(n)))
fn是有n个data时候你设计的classifior
V(f)是这个classifior的复杂度
R(fn)是risk, R(f)*是f类classifior的最优risk
他的期望的bound是随着sqrt(Vf)的增加而增加的
这就是理论上为什么不能把classifior的复杂度设置的太高的原因
因为你无法控制error的上限
【在 w********n 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: In practice, you can do anything about data when data is giving.
: You need to reduce the complexity of your model to overcome overfitting.
w*n
19 楼
My two cents:
Overfitting arises from two sources:
1. Training data is out-dated and can not represent future.
2. Model is trained too much on training data.
So either getting more new data or reducing model complexity to reduce
overfitting.
【在 l**********r 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: 面试官说如果一个机器学习的model 过拟合了,要怎么改进,我想到了说 cross
: validation再重新训练,感觉面试官很不满意,应该怎么改进呢?想不到其他方法了
Overfitting arises from two sources:
1. Training data is out-dated and can not represent future.
2. Model is trained too much on training data.
So either getting more new data or reducing model complexity to reduce
overfitting.
【在 l**********r 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: 面试官说如果一个机器学习的model 过拟合了,要怎么改进,我想到了说 cross
: validation再重新训练,感觉面试官很不满意,应该怎么改进呢?想不到其他方法了
l*r
22 楼
面试官说是linear regression的模型,还能进一步简化模型么?感觉已经很简单了啊
h*3
25 楼
没有说出regularization的,基本上不大可能过。
cross-validation是估计accuracy的variance,但并不是解决overfit的办法。
cross-validation也不能让你知道是否overfitting。比如,这个P(Y|X)就是random产
生,任何一个model最好的accuracy就是0.5,给你再多的training数据都是这样,你怎
么通过cross-validation知道你的model是否overfitting呢?
【在 l**********r 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: 面试官说如果一个机器学习的model 过拟合了,要怎么改进,我想到了说 cross
: validation再重新训练,感觉面试官很不满意,应该怎么改进呢?想不到其他方法了
cross-validation是估计accuracy的variance,但并不是解决overfit的办法。
cross-validation也不能让你知道是否overfitting。比如,这个P(Y|X)就是random产
生,任何一个model最好的accuracy就是0.5,给你再多的training数据都是这样,你怎
么通过cross-validation知道你的model是否overfitting呢?
【在 l**********r 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: 面试官说如果一个机器学习的model 过拟合了,要怎么改进,我想到了说 cross
: validation再重新训练,感觉面试官很不满意,应该怎么改进呢?想不到其他方法了
t*3
26 楼
cross validation画learning curve,如果cross validation error随着数据量的变大
和training error差距始终比较大就说明是overfitting了,反之如果在某个位置交叉
了就是underfitting
【在 h********3 的大作中提到】![](/moin_static193/solenoid/img/up.png)
: 没有说出regularization的,基本上不大可能过。
: cross-validation是估计accuracy的variance,但并不是解决overfit的办法。
: cross-validation也不能让你知道是否overfitting。比如,这个P(Y|X)就是random产
: 生,任何一个model最好的accuracy就是0.5,给你再多的training数据都是这样,你怎
: 么通过cross-validation知道你的model是否overfitting呢?
和training error差距始终比较大就说明是overfitting了,反之如果在某个位置交叉
了就是underfitting
【在 h********3 的大作中提到】
![](/moin_static193/solenoid/img/up.png)
: 没有说出regularization的,基本上不大可能过。
: cross-validation是估计accuracy的variance,但并不是解决overfit的办法。
: cross-validation也不能让你知道是否overfitting。比如,这个P(Y|X)就是random产
: 生,任何一个model最好的accuracy就是0.5,给你再多的training数据都是这样,你怎
: 么通过cross-validation知道你的model是否overfitting呢?
相关阅读
G家面试题三藩pre-ipo公司big data职位招聘请教,Power Management QA Engineer 一般都面什么题目?请问Amazon家电话面试是什么方式写code请问FB,Google这样的公司应届招聘容易么?【请教】Google和Facebook的offer (转载)有最近(10.1)到西雅图报道的朋友么?signon bonus什么时候给on-site 一周后联系HR发现几年前的简历被某网站贴出来了请教CS职业规划一道题relocation fee 都能干嘛?IBM T.J. Watson intern管住宿吗?这个为什么是newton method有人面过salesforce吗?换工作转h1b怎么回事急问H1b extension问以前编过多少行代码有什么用