非故意的错误结果是否需要撤稿?# Biology - 生物学
m*t
1 楼
非故意的,举个例子,
比如某人做了个machine learning的classifier,用个cross validation检测,效果很
好发了一篇paper。由于对数据来源有一些不了解,过了几年之后,发现原来用的数据
,里边有duplication(这是很正常了,现在很多高通量数据一个样品都测两三次,而
对ML来说,尽可能多的搜集数据也是很重要的,如果不是特别小心,的确很有可能出现
这种情况),比如一个样品被测了3次,三次基本信号都差不多,但在cross
validation的时候,可能2次分到了training里边一次分到了testing里边,这样
testing的准确度当然很高,但实际来说这是个overfitting的model,classifier的表
现根本没原文那么好?这种情况算不算造假?需要撤稿吗?随着发文章带来的一系列
benefit,比如PhD degree和绿卡等,是否要被取消?
比如某人做了个machine learning的classifier,用个cross validation检测,效果很
好发了一篇paper。由于对数据来源有一些不了解,过了几年之后,发现原来用的数据
,里边有duplication(这是很正常了,现在很多高通量数据一个样品都测两三次,而
对ML来说,尽可能多的搜集数据也是很重要的,如果不是特别小心,的确很有可能出现
这种情况),比如一个样品被测了3次,三次基本信号都差不多,但在cross
validation的时候,可能2次分到了training里边一次分到了testing里边,这样
testing的准确度当然很高,但实际来说这是个overfitting的model,classifier的表
现根本没原文那么好?这种情况算不算造假?需要撤稿吗?随着发文章带来的一系列
benefit,比如PhD degree和绿卡等,是否要被取消?