正在加载图片...
通过以上各步骤求出的fr和b具有可比性。当b<0时,题偏易;当 b>0时,题偏难。题库总是按b将库题分等。例如,按容易(b≤一3), 比较容易(一3<b≤-1),中等难度(-1<b≤1),比较难(1<b≤3),难 (b>3),可将库题分为五等。当然也可采用其他标准将库题分等。 PROX过程虽容易理解,但较复杂,再加上逐一测试,工作量大,因 而常用学科评估专家对拟入库题进行估计来推导有关参数值。这已成为 种可行的方法。在二级评分模型中,可以证明,用贝叶斯( Bayes)估计参 数得的难度值bB与专家评估难度b。有如下关系式 bB=0.613+1.333b (相关系数为0.712,误差标准差的估计为0.7383),或 b=1.5142+3181b+07218b (误差标准差的估计为0.70)。 通过率p与bn的关系为 0.53b-123b2 (误差标准差的估计为0.0017)。 通过率p与bB的关系为 bB=3.0516-6.1244p (相关系数为0.975,误差标准差的估计为0.073)。 我们认为,只要有一定数量的,并在测评题目方面有丰富经验的教师, 就可用上述关系求bB。类似于分数的等值定义可给出内容难度等值的定 义。如果在任一题组中(实际上取一个题目大样本)两个水平相同的专家组 评定的两题的百分等级相等,则称这两题的内容难度等值。例如,取60 道题构成大样本,由A、B两个专家组对其内容难度值进行评定。若题甲 由A评定的内容难度值为0.6,其所在百分等级是30,而题乙由B评定的 内容难度值为0.65,其所在百分等级也为30,则题甲与题乙的内容难度 值相等 (3)贮存库题建设题库 设置题卡是早期建设题库的主要方法,现代题卡主要由正文、答案 评分标准、使用情况、使用后记录、适宜性记录、及格要求度、各种参数 (a、b、c)值、命题人、审题人和编卡时间组成。为了便于査阅,还需对通过以上各步骤求出的 fr和 bi具有可比性。当 bi<0 时,题偏易;当 bi>0 时,题偏难。题库总是按 br将库题分等。例如,按容易(br≤-3), 比较容易(-3<bi≤-1),中等难度(-1<bi≤1),比较难(1<bi≤3),难 (bi>3),可将库题分为五等。当然也可采用其他标准将库题分等。 PROX 过程虽容易理解,但较复杂,再加上逐一测试,工作量大,因 而常用学科评估专家对拟入库题进行估计来推导有关参数值。这已成为一 种可行的方法。在二级评分模型中,可以证明,用贝叶斯(Bayes)估计参 数得的难度值 bB与专家评估难度 bη有如下关系式 bB=0.613+1.333bη (相关系数为 0.712,误差标准差的估计为 0.7383),或 (误差标准差的估计为 0.70)。 通过率 p 与 bη的关系为 (误差标准差的估计为 0.0017)。 通过率 p 与 bB的关系为 bB=3.0516-6.1244p (相关系数为 0.975,误差标准差的估计为 0.073)。 我们认为,只要有一定数量的,并在测评题目方面有丰富经验的教师, 就可用上述关系求 bB。类似于分数的等值定义可给出内容难度等值的定 义。如果在任一题组中(实际上取一个题目大样本)两个水平相同的专家组 评定的两题的百分等级相等,则称这两题的内容难度等值。例如,取 60 道题构成大样本,由 A、B 两个专家组对其内容难度值进行评定。若题甲 由 A 评定的内容难度值为 0.6,其所在百分等级是 30,而题乙由 B 评定的 内容难度值为 0.65,其所在百分等级也为 30,则题甲与题乙的内容难度 值相等。 (3)贮存库题建设题库 设置题卡是早期建设题库的主要方法,现代题卡主要由正文、答案、 评分标准、使用情况、使用后记录、适宜性记录、及格要求度、各种参数 (a、b、c)值、命题人、审题人和编卡时间组成。为了便于查阅,还需对
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有