第七 学习结 果的测量与评定
第七章 学习结 果的测量与评定
第一节概迷 什么是学习测量与评定 (-)什么是测量和测验 测量是用数学方式对人的行为的描述 教学过程中的测量是用数学的方式对学生学习行为的描述,主 要是借助于测验来进行。 测验是通过一系列的科学程序(如编制题目、施测和评分等)对 学生某一方面的学习行为进行测量 (二)什么是评定 教学过程中的评定是根据一定的标准对学生的学习行 为进行估价的过程
2 第一节 概述 ◼ 一、什么是学习测量与评定 ◼ (一)什么是测量和测验 测量是用数学方式对人的行为的描述。 教学过程中的测量是用数学的方式对学生学习行为的描述,主 要是借助于测验来进行。 测验是通过一系列的科学程序(如编制题目、施测和评分等)对 学生某一方面的学习行为进行测量。 ◼ (二)什么是评定 教学过程中的评定是根据一定的标准对学生的学习行 为进行估价的过程
二、学习测量和评定的主要功能 ()诊断功能 二)反馈与鞭策功能 1.为教师的教学提供反馈信息 2.激发学生的的学习动机 (三)管理功能 编班分组和升留级的依据 职业指导的作用 3.教育科学研究的工具 (四)教育心理功能
3 ◼ 二 、学习测量和评定的主要功能 ◼ (一)诊断功能 ◼ (二)反馈与鞭策功能 1.为教师的教学提供反馈信息 2.激发学生的的学习动机 ◼ (三)管理功能 1.编班分组和升留级的依据 2.职业指导的作用 3.教育科学研究的工具 ◼ (四)教育心理功能
前刹 定以育日标 <评定 制定教学讨划款学,后测 () 测) 锋改教学日标 修改教学计刘 确定新的教育日杯 图7-1测量与评定在教学过程中的反惯作用
4
三、教育工作者应具备的测量与评定的知识和能力 ①理解与清楚地表述教学和管理目标,懂得怎样通过教学 和管理活动达到目标,全面了解测量与评定的涵义及评定对教 学及管理的意义。 ②理解有效测量和评定条件,明确自己在编制、选择和使 用测量工具时所扮演的角色。 ③能自行编制日常教学使用的测验,能适当地主持测验并 有效地使用测验的结果,以为改进教学和管理之用;能选择适 当的标准化测验。 ④能编制、选择与使用非测验式的测验工具。 ⑤能综合解释测验的分数和非测验式测量的结果,作出评 定。明确各种测验的用途及限制。 ⑥能根据评定的结果,改进自己的教学和管理工作。 此外,对参与评价的人来说,还应有高尚的人格,应当使 自己参与的评定工作合乎道德规范,不应使学生或教师感到高 度焦虑,损伤他们的自尊心或引起恶性竞争
5 ◼ 三、教育工作者应具备的测量与评定的知识和能力 ◼ ①理解与清楚地表述教学和管理目标,懂得怎样通过教学 和管理活动达到目标,全面了解测量与评定的涵义及评定对教 学及管理的意义。 ◼ ②理解有效测量和评定条件,明确自己在编制、选择和使 用测量工具时所扮演的角色。 ◼ ③能自行编制日常教学使用的测验,能适当地主持测验并 有效地使用测验的结果,以为改进教学和管理之用;能选择适 当的标准化测验。 ◼ ④能编制、选择与使用非测验式的测验工具。 ◼ ⑤能综合解释测验的分数和非测验式测量的结果,作出评 定。明确各种测验的用途及限制。 ◼ ⑥能根据评定的结果,改进自己的教学和管理工作。 ◼ 此外,对参与评价的人来说,还应有高尚的人格,应当使 自己参与的评定工作合乎道德规范,不应使学生或教师感到高 度焦虑,损伤他们的自尊心或引起恶性竞争
四、学习评定的分类 布鲁姆(Blom,B.S)的分类: (一)配置性评定 要了解是香具有达到教學目称所2需的基础知氨和援 备状态 二)形成性评定 般是在教和学的过程中进行的,目的在于了解教学结 果,探究教学中所存在的问题的缺陷,以便对教学工作进 行调整。 (三)总结性评定 般在学期末进行,目的是了解学生通过一学期的学 习,是否达到教学目的的要求,以此作出较全面的总结性 评定
6 ◼ 四、学习评定的分类 ◼ 布鲁姆(Bloom,B.S)的分类: ◼ (一)配置性评定 一般在各学年、各学期开始时或开始前施行,其目的是 要了解学生是否具有达到教学目标所必需的基础知识和技 能——学生的准备状态。 ◼ (二)形成性评定 一般是在教和学的过程中进行的,目的在于了解教学结 果,探究教学中所存在的问题的缺陷,以便对教学工作进 行调整。 ◼ (三)总结性评定 一般在学期末进行,目的是了解学生通过—学期的学 习,是否达到教学目的的要求,以此作出较全面的总结性 评定
五、有效测验的必要条件 (一)效度 测验效度是指测量的真实性、正确性,即该测验与所 要测量的目标特征相符合的程度。如果一致性高,说明这 个测验的效度高,反之则低。 效度通常是利用该测验的结果与一个反映测量目标的 参照标准(效标)之间的相关来表示,所求得的相关系数即 为效度系数。相关系数越大,说明效度越高。一般要求这 类测验的效度值应当在0.35至0.60之间
7 ◼ 五、有效测验的必要条件 ◼ (一)效度 ◼ 测验效度是指测量的真实性、正确性,即该测验与所 要测量的目标特征相符合的程度。如果一致性高,说明这 个测验的效度高,反之则低。 ◼ 效度通常是利用该测验的结果与一个反映测量目标的 参照标准(效标)之间的相关来表示,所求得的相关系数即 为效度系数。相关系数越大,说明效度越高。—般要求这 类测验的效度值应当在0.35至0.60之间
(二)信度 信度是反映测验分数的稳定性的可靠性的指标,是指测量的前后一致 性程度,只有信度高的测验才能够作为一个稳定可靠的测量工具加以应用 国外一般要求学科成绩测验的信度值要在0.90以上。信度值是用相关 系数来表示的,又称为信度系数。 计算信度系数的方法主要有: ①再测法:我们用某一个测验对相同的学生前后施测两次,计算出这 两次测验成绩的相关就可得到再测信度; ②复本法:这种方法需要编制出两套以上内容、形式、数量、难度等 方面都等值的测验,然后根据同一组学生接受两次复本测验的得分计算出 相关系数,就可得到复本信度; ③分半法:当一种测验没有复本而且只能施测一次的情况下,通常采 用分半法来估计信度。这种方法是将一套测验分成对等的两半,根据每个 人在这两半试题中的得分所求得的相关系数即为半分信度。 在学科测验中,较多的是应用分半法和复本法来计算测验题的信度
8 ◼ (二)信度 ◼ 信度是反映测验分数的稳定性的可靠性的指标,是指测量的前后一致 性程度,只有信度高的测验才能够作为一个稳定可靠的测量工具加以应用 。国外一般要求学科成绩测验的信度值要在0.90以上。 信度值是用相关 系数来表示的,又称为信度系数。 ◼ 计算信度系数的方法主要有: ◼ ①再测法:我们用某一个测验对相同的学生前后施测两次,计算出这 两次测验成绩的相关就可得到再测信度; ◼ ②复本法:这种方法需要编制出两套以上内容、形式、数量、难度等 方面都等值的测验,然后根据同一组学生接受两次复本测验的得分计算出 相关系数,就可得到复本信度; ◼ ③分半法:当一种测验没有复本而且只能施测一次的情况下,通常采 用分半法来估计信度。这种方法是将一套测验分成对等的两半,根据每个 人在这两半试题中的得分所求得的相关系数即为半分信度。 ◼ 在学科测验中,较多的是应用分半法和复本法来计算测验题的信度
(三)难度 难度是指一套测验中试题的难易程度,这是用来 进行题目分析和评价试题的主要指标之一。难度的计 算可依据试题形式的不同采用以下两种方法,其公式 为: 某题难度=通过该题的人数×10 某题难度=考生在该题所得的平均分×10%
9 ◼ (三)难度 ◼ 难度是指—套测验中试题的难易程度,这是用来 进行题目分析和评价试题的主要指标之一。难度的计 算可依据试题形式的不同采用以下两种方法,其公式 为:
(四)区分度 区分度是测验题目对考生水平鉴别能力的指标,是测 验题目能够鉴别受测者水平的程度。 区分度的计算多采用相关法,即以考生在某个题目上 的得分与总分的相关作为该题的区分度值,相关越高,区 分度越好。国外应用在教育上的标准化测验要求优秀题目 的区分度在0.30以上,否则就需加以改进或淘汰。 (五)可用性 即测验在解释学生的能力、知识等方面有多大用处 测验的形式与内容是否适合学生的年龄特征;测验所花的 时间和人力是否合适;以及评分是否客观,主持测验是否 通过过特殊训练等。如果在这些方面使人不能接受,测验 的可用性就低
10 ◼ (四)区分度 ◼ 区分度是测验题目对考生水平鉴别能力的指标,是测 验题目能够鉴别受测者水平的程度。 ◼ 区分度的计算多采用相关法,即以考生在某个题目上 的得分与总分的相关作为该题的区分度值,相关越高,区 分度越好。国外应用在教育上的标准化测验要求优秀题目 的区分度在0.30以上,否则就需加以改进或淘汰。 ◼ (五)可用性 ◼ 即测验在解释学生的能力、知识等方面有多大用处; 测验的形式与内容是否适合学生的年龄特征;测验所花的 时间和人力是否合适;以及评分是否客观,主持测验是否 通过过特殊训练等。如果在这些方面使人不能接受,测验 的可用性就低