machine learning 课程项目的presentation: 大疑问-???# DataSciences - 数据科学
f*6
1 楼
有一个组的整个建模过程如下:
1)组员4个,用同一个training dataset,建立1~2个classification model(logistic
regression,SVM,NN);
2)总共8个model,最后用vote的方法决定每个record的class. 超过半数以上是yes的就
判断是yes, 否则为no.
我的疑问是:当新数据进来的时候,这个vote的结果对预测这个数据的class没有任何
参考意义。
不能理解这样的做法,不知道工业界里建模时有这样运用的吗?
1)组员4个,用同一个training dataset,建立1~2个classification model(logistic
regression,SVM,NN);
2)总共8个model,最后用vote的方法决定每个record的class. 超过半数以上是yes的就
判断是yes, 否则为no.
我的疑问是:当新数据进来的时候,这个vote的结果对预测这个数据的class没有任何
参考意义。
不能理解这样的做法,不知道工业界里建模时有这样运用的吗?