m*y
1 楼
美国的各项考试(test, exam),包括各种评估(evaluation),测试(assessment),都需要
做先期的pilot study (先期试验??)以确保这些考试是可靠(reliable)
和有效(valid)的.这样才可以大面积使用。关于考试的有效性/正确性(validity)分好
多种,比如content validity, construct validity 等等。
其中很重要的一个就是要保证题目确实是在衡量你要衡量的东西。比如在数学考试中,如
果题目用到了很深的词汇或者复杂的句型,这样题目就变成考察了学生的阅读能力而不是
数学能力。这样,如果题目没有得到及时地改正,考生就会起诉这样的考试,认为考试不
有效,所以不能正确衡量他的数学能力。这样关于起诉考试的例子举不胜举。在加州曾经
是用一种考试去衡量消防员工作能力的测试,因为后来消防员起诉这个测试的题目不是考
察他们的工作能力而是考察他们的阅读能力,结果这个测试被迫更改这些题目。
在中国人眼里,这个简直不能叫问题。有人会说这是在找借口,其实原来我也是这么认为
。是啊,对于考试,我向来都是顶礼膜拜的,哪怕老师出的题
做先期的pilot study (先期试验??)以确保这些考试是可靠(reliable)
和有效(valid)的.这样才可以大面积使用。关于考试的有效性/正确性(validity)分好
多种,比如content validity, construct validity 等等。
其中很重要的一个就是要保证题目确实是在衡量你要衡量的东西。比如在数学考试中,如
果题目用到了很深的词汇或者复杂的句型,这样题目就变成考察了学生的阅读能力而不是
数学能力。这样,如果题目没有得到及时地改正,考生就会起诉这样的考试,认为考试不
有效,所以不能正确衡量他的数学能力。这样关于起诉考试的例子举不胜举。在加州曾经
是用一种考试去衡量消防员工作能力的测试,因为后来消防员起诉这个测试的题目不是考
察他们的工作能力而是考察他们的阅读能力,结果这个测试被迫更改这些题目。
在中国人眼里,这个简直不能叫问题。有人会说这是在找借口,其实原来我也是这么认为
。是啊,对于考试,我向来都是顶礼膜拜的,哪怕老师出的题