Redian新闻
>
出一个machine learning classification的题目
avatar
出一个machine learning classification的题目# DataSciences - 数据科学
k*z
1
自己想的
比方我人为产生一个数据
有10000个sample, 100个变量X1,X2,,,X100
sample分成5个classes, 是根据其中10个变量的的方程值的分布分成5分
比方说一个简单的方程
Y=X1+X6*X20/X30-X38+10*X44^2+X55/X66-10X77+x88
当然我不会告诉你,现在的ML算法能搞清楚这个classification吗?
avatar
k*s
2
我觉得用random forest regression可以筛出来
avatar
r*t
3
这个应该用lasso做variable selection和linear regression。可以算出公式系数来。
如果非要用machine learning做,比如已知其中80%的分类,预测剩余的20%,random
forest之类的方法也能做出正确的分类来。但是没办法告诉具体的variable和系数。
avatar
H*f
4
我觉得,如果1,多项式里没有error term,而且2,假定多项式degree不超过3,比如
你的那个方程,那应该能用lasso学出来
如果多项式再复杂一些就得用别的模型,还可以预测,但没法还原你的多项式,准确度
估计会差些,毕竟模型不对了
avatar
c*g
5
除法目前没戏,可以polynomial拟合。但是次数过高一定会有过拟合问题。机器学习从
来不是去得到正确的公式,而是得到相对相似,合理的结果。
avatar
H*f
6
可以每个变量都取倒数当作新变量,这样让除变乘


: 除法目前没戏,可以polynomial拟合。但是次数过高一定会有过拟合问题。机器
学习从

: 来不是去得到正确的公式,而是得到相对相似,合理的结果。



【在 c******g 的大作中提到】
: 除法目前没戏,可以polynomial拟合。但是次数过高一定会有过拟合问题。机器学习从
: 来不是去得到正确的公式,而是得到相对相似,合理的结果。

avatar
e*6
7
线性不行,tree和mlp可能行,看训练样本量了。不过感觉够呛
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。