第六章实验研究 实验是发现真理的基础,也是检验真理的方式。在科学史上,重大的发现和突破都与科 学实验紧密联系。当今重大的教育改革、教学方法的革新大都以实验作为其理论支撑或依据 实验法在教育研究中已成为主导性的研究方法,并日益为广大教育工作者所接受、运用。 实验设计是实验研究的关键,本章从实验设计的角度着重介绍实验变量的选择与控制, 实验的内外在效度,以及实验配组和实验模式。 第—节实验法概述 、什么是实验法 实验法是根据研究假设,运用一定的人为手段,主动干预或控制研究对象的发生、发展 过程,并通过观察、测量、比较等方式探索、验证教育现象因果关系的研究方法 实验是一个被人们广泛运用的名词,并具有十分宽泛的含义。当人们尝试用一种新方法 或新程序去看效果如何,我们便可称其为—一项实验或一个实验过程。如伽利略将两只不同重 量的铁球从高处同时落下,看哪只球先落地,这就是在做实验:爱迪生尝试用不同的灯丝材 料硏制灯泡,以决定用哪种材料,这也是在做实验。幼儿园教儿童知道什么物品在水里是沉 的、什么物品在水里是浮的,让儿童直接尝试将有关物品放入水中,这也是在进行实验。实 验的基本概念就是在精心安排的一个或多个自变量的情境中,尝试做什么,然后观其效应 实验法有以下几个特点: 以假设为前提 任何实验都是有理论框架的,有研究假设的,即都是在一定理论的指导下,通过实际的 观察、测量等手段来检验假设的正确与否。实验假设在先,实验实施在后:先有理论框架 再有实践操作。整个实验过程通常是围绕着验证研究假设展开的,假设是实验研究的核心 2.要控制条件 实验法的精髓在于对实验条件的控制。没有控制,便无所谓实验。控制条件通常指主动 操纵自变量,客观地测定因变量,严格地控制无关变量。控制是实验法不同于观察法和调査 法的根本特点。观察法和调查法往往是以不干涉研究对象的原有状态为前提的,它们不要求 人为地去控制各种条件,只是等待行为的自然呈现。而实验法则要主动地去控制条件或创设 条件,从而使有关现象在一定条件下产生,或将某些因素分离出来进行观测,或将某些因素 控制起来使之不对结果产生影响,以纯化研究变量之间的关系 3.能揭示因果关系 探索规律性的东西是实验追求的直接目标。实验法探求的就是事物之间或变量之间的因 果关系。整个实验的理论框架和操作程序就是按如何验证因果关系而设计的。观察法和调查 法有时也可得出事物之间存在某种联系的结论,但这些联系究竟什么是因,什么是果,往往 难以作出确切的判断。如,看暴力电视与儿童侵犯性行为的关系,通过调查和观察发现两者 有联系,但有人认为看暴力电视是原因,侵犯性行为是结果。也有人认为具有侵犯性行为的
1 第六章 实验研究 实验是发现真理的基础,也是检验真理的方式。在科学史上,重大的发现和突破都与科 学实验紧密联系。当今重大的教育改革、教学方法的革新大都以实验作为其理论支撑或依据。 实验法在教育研究中已成为主导性的研究方法,并日益为广大教育工作者所接受、运用。 实验设计是实验研究的关键,本章从实验设计的角度着重介绍实验变量的选择与控制, 实验的内外在效度,以及实验配组和实验模式。 第—节 实验法概述 一、什么是实验法 实验法是根据研究假设,运用一定的人为手段,主动干预或控制研究对象的发生、发展 过程,并通过观察、测量、比较等方式探索、验证教育现象因果关系的研究方法。 实验是一个被人们广泛运用的名词,并具有十分宽泛的含义。当人们尝试用—种新方法 或新程序去看效果如何,我们便可称其为—项实验或—个实验过程。如伽利略将两只不同重 量的铁球从高处同时落下,看哪只球先落地,这就是在做实验;爱迪生尝试用不同的灯丝材 料研制灯泡,以决定用哪种材料,这也是在做实验。幼儿园教儿童知道什么物品在水里是沉 的、什么物品在水里是浮的,让儿童直接尝试将有关物品放入水中,这也是在进行实验。实 验的基本概念就是在精心安排的一个或多个自变量的情境中,尝试做什么,然后观其效应。 实验法有以下几个特点: 1.以假设为前提 任何实验都是有理论框架的,有研究假设的,即都是在一定理论的指导下,通过实际的 观察、测量等手段来检验假设的正确与否。实验假设在先,实验实施在后;先有理论框架, 再有实践操作。整个实验过程通常是围绕着验证研究假设展开的,假设是实验研究的核心。 2.要控制条件 实验法的精髓在于对实验条件的控制。没有控制,便无所谓实验。控制条件通常指主动 操纵自变量,客观地测定因变量,严格地控制无关变量。控制是实验法不同于观察法和调查 法的根本特点。观察法和调查法往往是以不干涉研究对象的原有状态为前提的,它们不要求 人为地去控制各种条件,只是等待行为的自然呈现。而实验法则要主动地去控制条件或创设 条件,从而使有关现象在一定条件下产生,或将某些因素分离出来进行观测,或将某些因素 控制起来使之不对结果产生影响,以纯化研究变量之间的关系。 3.能揭示因果关系 探索规律性的东西是实验追求的直接目标。实验法探求的就是事物之间或变量之间的因 果关系。整个实验的理论框架和操作程序就是按如何验证因果关系而设计的。观察法和调查 法有时也可得出事物之间存在某种联系的结论,但这些联系究竟什么是因,什么是果,往往 难以作出确切的判断。如,看暴力电视与儿童侵犯性行为的关系,通过调查和观察发现两者 有联系,但有人认为看暴力电视是原因,侵犯性行为是结果。也有人认为具有侵犯性行为的
儿童更喜欢看暴力电视。要解决这样的问题,探求其中的因果关系,只能用实验法来揭示其 因果关系。可找两类性格不同的儿童,向他们提供暴力电视,观测其行为表现。也可让两组 被试任意选择电视节目,通过比较来确定暴力电视与侵犯性行为的因果关系。 4.可重复验证 实验是可以重复验证的。对同一被试或相似被试在相似的控制条件下,应得出相似的研 究结果。这种重复验证的程度越高,实验研究的可靠性、效果也就越大。不能重复验证的实 验,人们很难判断其数据的准确性和结论的可靠性。可重复验证也是实验研究成果推广运用 的必备条件,是评判实验优劣的标准之 在实验法的四个特点中,要有假设,有理论框架意味着要明确研究的目标,要提出有价 值的问题:控制条件则是实验研究结果可靠性的保证:揭示因果关系就是要探究变量之间规 律性的东西:而可重复验证则体现实验设计本身的科学性和严密性 近二十年来,广大教育工作者从事教育实验研究的热情空前高涨,据不完全统计,全国 冠于实验研究的、有案可查的不下几千。但从总体上讲,实验法运用还不充分,科学化水平 不高。有些实验徒有虚名,很多实验既没有假设,也没有控制,既没有对照组,也没有验证 和重复。还有些实验名称冠以整体实验,综合实验,但具体实验因素有哪些,哪些是自变量, 哪些是因变量都不清楚。很多实验研究最后无法确定因果关系,研究成果勉强,无法推广。 当然,广大教师、学校领导要求改革的愿望是好的,热情是高的,这种积极性应该保护,但 他们缺乏的是有关科学研究的方法,不知道什么是实验,怎样进行实验 实验是一种研究情境,是科学研究经常采纳的方法和程序。在所有实验中,教育实验可 能要比物理、化学实验复杂和困难得多。这是因为教育实验通常涉及到人,人的心理、行为。 人是难以重复,是一个十分复杂的统一体,要使他们的心理、行为保持一致不是件容易事 另外他们也不像从口袋里捡豆子那样容易选择。例如,同样是5岁儿童、同样在一个班上学 习生活,但有的儿童能从1数到100,有的连5都数不到。学习者差异之大,令人难以想象 这种差异有来自生理的,心理的,智力上的差异,也有来自学习外部环境的差异。而实验法 的目的之一,就是要把这些因素分离出来,然后探讨其中的因果关系。 、教育实验的分类和一般过程 实验的分类 教育实验的分类多种多样,从不同角度、不同层次可有不同的分类 按实验场所划分,可分为现场实验(自然实验)和实验室实验。现场实验指实验是在教 育教学的现实情境中进行的。实验室实验指在实验室环境中,在严格控制条件下进行的实验, 例如儿童听力测验要在听力实验室中进行,以控制外部噪音对儿童听力的影响。实验室实验 条件控制严密,可保证实验结果的可靠性,它的基本思想是,只要无关变量控制得好,自变 量与因变量的关系便可明确显示。一般实验室实验涉及因素较少,被试量较小,适合于较单 纯的问题。 按实验法的划分,可分为探索性实验和验证性实验。探索性实验具有独创性,探求未知, 目的在于获取新知。验证性实验是对己有的知识、结论等进行重复检验或对已有的实验成果 进行再实验,以及移植、模仿和改造。 按自变量因素的多少划分,可分为单因素实验和多因素实验。单因素实验指实验中只有 个自变量,研究目的是探讨变量的一一对应关系。多因素实验指实验中含有多个自变量, 研究目的是探讨多个变量之间的组合关系 按实验控制程度划分,可分为前实验、准实验、真实验。前实验对无关变量的控制不够 充分,是一种不理想的实验。真实验能比较满意地控制无关变量的影响,可以获得比较准确 2
2 儿童更喜欢看暴力电视。要解决这样的问题,探求其中的因果关系,只能用实验法来揭示其 因果关系。可找两类性格不同的儿童,向他们提供暴力电视,观测其行为表现。也可让两组 被试任意选择电视节目,通过比较来确定暴力电视与侵犯性行为的因果关系。 4.可重复验证 实验是可以重复验证的。对同一被试或相似被试在相似的控制条件下,应得出相似的研 究结果。这种重复验证的程度越高,实验研究的可靠性、效果也就越大。不能重复验证的实 验,人们很难判断其数据的准确性和结论的可靠性。可重复验证也是实验研究成果推广运用 的必备条件,是评判实验优劣的标准之一。 在实验法的四个特点中,要有假设,有理论框架意味着要明确研究的目标,要提出有价 值的问题;控制条件则是实验研究结果可靠性的保证;揭示因果关系就是要探究变量之间规 律性的东西;而可重复验证则体现实验设计本身的科学性和严密性。 近二十年来,广大教育工作者从事教育实验研究的热情空前高涨,据不完全统计,全国 冠于实验研究的、有案可查的不下几千。但从总体上讲,实验法运用还不充分,科学化水平 不高。有些实验徒有虚名,很多实验既没有假设,也没有控制,既没有对照组,也没有验证 和重复。还有些实验名称冠以整体实验,综合实验,但具体实验因素有哪些,哪些是自变量, 哪些是因变量都不清楚。很多实验研究最后无法确定因果关系,研究成果勉强,无法推广。 当然,广大教师、学校领导要求改革的愿望是好的,热情是高的,这种积极性应该保护,但 他们缺乏的是有关科学研究的方法,不知道什么是实验,怎样进行实验。 实验是一种研究情境,是科学研究经常采纳的方法和程序。在所有实验中,教育实验可 能要比物理、化学实验复杂和困难得多。这是因为教育实验通常涉及到人,人的心理、行为。 人是难以重复,是—个十分复杂的统一体,要使他们的心理、行为保持一致不是件容易事, 另外他们也不像从口袋里捡豆子那样容易选择。例如,同样是 5 岁儿童、同样在一个班上学 习生活,但有的儿童能从 1 数到 100,有的连 5 都数不到。学习者差异之大,令人难以想象, 这种差异有来自生理的,心理的,智力上的差异,也有来自学习外部环境的差异。而实验法 的目的之一,就是要把这些因素分离出来,然后探讨其中的因果关系。 二、教育实验的分类和一般过程 1.实验的分类 教育实验的分类多种多样,从不同角度、不同层次可有不同的分类。 按实验场所划分,可分为现场实验(自然实验)和实验室实验。现场实验指实验是在教 育教学的现实情境中进行的。实验室实验指在实验室环境中,在严格控制条件下进行的实验, 例如儿童听力测验要在听力实验室中进行,以控制外部噪音对儿童听力的影响。实验室实验 条件控制严密,可保证实验结果的可靠性,它的基本思想是,只要无关变量控制得好,自变 量与因变量的关系便可明确显示。一般实验室实验涉及因素较少,被试量较小,适合于较单 纯的问题。 按实验法的划分,可分为探索性实验和验证性实验。探索性实验具有独创性,探求未知, 目的在于获取新知。验证性实验是对已有的知识、结论等进行重复检验或对已有的实验成果 进行再实验,以及移植、模仿和改造。 按自变量因素的多少划分,可分为单因素实验和多因素实验。单因素实验指实验中只有 一个自变量,研究目的是探讨变量的一一对应关系。多因素实验指实验中含有多个自变量, 研究目的是探讨多个变量之间的组合关系。 按实验控制程度划分,可分为前实验、准实验、真实验。前实验对无关变量的控制不够 充分,是一种不理想的实验。真实验能比较满意地控制无关变量的影响,可以获得比较准确
的实验结果。而准实验在控制程度上则介于前实验和真实验的中间 2.实验的一般过程 实验法的一般过程可分为三个阶段: ①准备阶段 实验准备阶段的具体步骤包括:选定课题,形成实验假设,确定实验自变量和因变量 下操作定义,制定控制无关变量的措施,选择被试,分配被试到实验组或对照组,选定测量 方法与工具等,最终形成具体的实验方案和工作计划 ②实施阶段 实验实施阶段的具体内容包括:执行实验程序、实施实验方案,观察实验对象,观测、 记录所需的资料和数据,以及对资料数据的加工整理 ③总结阶段 实验总结阶段的具体任务包括:对资料数据的分析,概括研究结果,形成研究结论,撰 写实验报告,以及评价验证研究成果和成果的推广应用 下面是实验的一般过程的流程图(图6-1)。 课题 文献检索 阅读和思考 有关的成果 有关理论和概念 归纳 汇 演绎 入 假设 (以及有关变量) 验证 研究成果 操作定义 预测 数据收集 操作化 设计 和分析 测量手段 实验设计 图6一1实验研究流程图 实验法是教育研究中最重要的研究方法。它具有严密的组织系统;有一套必须遵守的程 序规则:逻辑关系清晰明确:;应用范围较广,尤其适用于因果关系的研究:能排除无关因素 的干扰,创设情境,使自然条件浓缩、净化:所得结论较可靠
3 的实验结果。而准实验在控制程度上则介于前实验和真实验的中间。 2.实验的一般过程 实验法的一般过程可分为三个阶段: ①准备阶段 实验准备阶段的具体步骤包括:选定课题,形成实验假设,确定实验自变量和因变量, 下操作定义,制定控制无关变量的措施,选择被试,分配被试到实验组或对照组,选定测量 方法与工具等,最终形成具体的实验方案和工作计划。 ②实施阶段 实验实施阶段的具体内容包括:执行实验程序、实施实验方案,观察实验对象,观测、 记录所需的资料和数据,以及对资料数据的加工整理。 ③总结阶段 实验总结阶段的具体任务包括:对资料数据的分析,概括研究结果,形成研究结论,撰 写实验报告,以及评价验证研究成果和成果的推广应用。 下面是实验的一般过程的流程图(图 6—1)。 图 6 一 l 实验研究流程图 实验法是教育研究中最重要的研究方法。它具有严密的组织系统;有一套必须遵守的程 序规则;逻辑关系清晰明确;应用范围较广,尤其适用于因果关系的研究;能排除无关因素 的干扰,创设情境,使自然条件浓缩、净化;所得结论较可靠。 课 题 有关的成果 有关理论和概念 假设 (以及有关变量) 研究成果 预测 测量手段 实验设计 文献检索 阅读和思考 演绎 归纳 验证 设计 数据收集 操作化 和分析 操 作 定 义 汇 入
第二节实验变量与实验效度 广义的实验设计指进行一项实验研究的整体设计,即在确定课题的基础上提出假设,识 别变量,选择样本,确定实验的组织形式和具体方法以及整个研究的进程和策略。狭义的实 验设计指实验过程中的组织形式、被试分配形式和实验变量介入或控制的形式。实验设计正 如建筑师在得知建房的基本要求后,根据可能的条件而制定的建筑蓝图一样,是为实施而预 先拟定的计划 实验设计是关系到实验是否有效的关键因素,实验的成功与否,很大程度上取决于实验 设计的好坏。实验设计要遵循以下三条基本原则: ①随机化原则随机化是实验设计中控制无关变量的最重要的方法,也是最有效的方 法。随机化通常包括两个方面,一是被试应从总体中随机选择;二是被试的配组(分到实验 组或对照组)应随机分配。 ②可控制原则控制是实验的基本特征,没有控制就没有实验。一个实验能否有效地得 出因果关系的结论,最重要的是看实验设计能否有效地控制无关变量 ③可重复原则可重复是对实验的精确性和可靠性的要求,也是检验实验结果有效性的 标准 实验设计通常要综合考虑以下内容:研究假设,实验变量(包括自变量的呈现方式,因 变量的测定指标及方法,无关变量的控制措施等),被试的选择和分配,实验采用的组织模 式,统计处理方法,具体实施步骤等。 实验设计的基本思想有二:一是使自变量对因变量的作用最大化,让自变量和因变量的 关系凸现;二是使无关变量对因变量的影响最小化,不让无关变量对因变量产生干扰作用或 使这种干扰作用控制在最小范围内,见图6-2 操纵 最大化 自变量 测定 因变量 无关变量 最小化 图62实验设计基本思想示意图 、实验变量的选择与控制 在实验过程中,变量的选择与控制对实验的成功与否具有重要意义,它包括三方面的内 1.自变量的操纵 自变量是变化的措施和条件,又称实验处理。它是研究者创设和操纵的情境或刺激物
4 第二节 实验变量与实验效度 一、实验设计 广义的实验设计指进行一项实验研究的整体设计,即在确定课题的基础上提出假设,识 别变量,选择样本,确定实验的组织形式和具体方法以及整个研究的进程和策略。狭义的实 验设计指实验过程中的组织形式、被试分配形式和实验变量介入或控制的形式。实验设计正 如建筑师在得知建房的基本要求后,根据可能的条件而制定的建筑蓝图一样,是为实施而预 先拟定的计划。 实验设计是关系到实验是否有效的关键因素,实验的成功与否,很大程度上取决于实验 设计的好坏。实验设计要遵循以下三条基本原则: ①随机化原则 随机化是实验设计中控制无关变量的最重要的方法,也是最有效的方 法。随机化通常包括两个方面,一是被试应从总体中随机选择;二是被试的配组(分到实验 组或对照组)应随机分配。 ②可控制原则 控制是实验的基本特征,没有控制就没有实验。一个实验能否有效地得 出因果关系的结论,最重要的是看实验设计能否有效地控制无关变量。 ③可重复原则 可重复是对实验的精确性和可靠性的要求,也是检验实验结果有效性的 标准。 实验设计通常要综合考虑以下内容:研究假设,实验变量(包括自变量的呈现方式,因 变量的测定指标及方法,无关变量的控制措施等),被试的选择和分配,实验采用的组织模 式,统计处理方法,具体实施步骤等。 实验设计的基本思想有二:一是使自变量对因变量的作用最大化,让自变量和因变量的 关系凸现;二是使无关变量对因变量的影响最小化,不让无关变量对因变量产生干扰作用或 使这种干扰作用控制在最小范围内,见图 6—2。 图 6—2 实验设计基本思想示意图 二、实验变量的选择与控制 在实验过程中,变量的选择与控制对实验的成功与否具有重要意义,它包括三方面的内 容: 1.自变量的操纵 自变量是变化的措施和条件,又称实验处理。它是研究者创设和操纵的情境或刺激物, 自变量 无关变量 因变量 操纵 控制 最大化 最小化 测定
用它能促使被试产生反应和变化。实验目的是看自变量的介入会引起被试什么反应和变化 例如,要提高大班儿童学业成绩,就要主动采取措施,或使用新的教学方法,或改变学习的 环境,或重新选择学习材料,或变换教学的组织形式等,这些都可作为研究者操纵的自变量, 研究者通过操纵某个自变量看它是否会提高儿童的学业成绩 个自变量的实验称单因素实验,两个以上自变量的实验称多因素实验。自变量的变化 等级称为水平。如,课外作业时间与学习成绩的实验研究,课外作业时间是一个自变量,研 究中可将作业时间划分为四个等级,0.5小时、1小时、1.5小时、2小时,那么这个实验是 个自变量,四种水平(或四种实验处理)的实验研究。一般来说,一个自变量至少有两种 水平,出现或不出现。儿童的年级可有三种水平:大班、中班、小班。儿童的家庭背景可分 为两种水平:城市的、农村的等。 自变量的操纵往往涉及实验处理的次数、强度、方式、程序、介入时间、延续时间等问 题,研究者应根据研究假设、实验设计的要求和实际情况进行考虑 2.因变量的测定 因变量是研究者要观测的变量,是由自变量引起的在被试身上产生的反应变化,因变量 的变化依赖于自变量的变化,实验目的就是要通过因变量的测定来研究自变量与因变量之间 是否存在因果关系。因变量的一个重要特征是它可以通过直接或间接的方式被观察,被测量, 并且可以转化为数据形式。例如,测验分数,考试成绩、评定等级、反应时间、答题的正误 百分数等 因变量的测定关键是要有测量的指标,测量指标涉及测量方法、工具、材料、次数、时 间、插入点的安排等。当然有现成的测验量表、客观性试题最好。一般选择测量指标应根据 研究假设、实验设计的特点,现有的测量工具、手段等作具体分析,可考虑以下几方面: ①敏感性所选指标对自变量的变化有较高的分辨能力。如五分制评分与百分制评分, 百分制敏感性较高 ②客观性所选指标具有可靠性和准确性,指标的解释不以研究者或被试的主观意志为 转移 ③稳定性所选指标在重复测验中数值接近,能获得稳定一致的结果。 ④经济性所选指标应观测方便,数据转换容易,能节省时间和精力。 总之,因变量的测定同因变量本身的复杂程度有关,同实验要求达到的精确程度有关, 同现有的测量工具、测量手段有关,同研究的定性定量水平有关。 3.无关变量的控制无关变量是研究中除了自变量和因变量之外的一切变量,是与实 验目的无关的变量。由于无关变量会影响因变量的测定,会对判断自变量和因变量的因果关 系造成干扰,因此在实验设计时需要对其进行控制。控制无关变量是实验研究的一个关键问 为了使自变量和因变量的对应关系显现出来,必须“净化”实验过程中的变量,也就是说 要把无关因素人为地控制起来,以免实验过程中变量相互混淆,无法判断因果关系。一般来 说对无关变量控制的程度越高,实验的可信度也越高。当然要完全彻底控制无关变量是办不 到的,因为在教育实验中无关因素非常之多,研究者难以一一加以控制,通常讲的控制是指 尽可能地将其中最明显的无关变量、对实验效果起重大影响的无关变量挑选出来,加以控制 不对无关变量进行控制,实验结果便无法解释,会导致实验的失败。控制无关变量的方法有: 几化 ①随机 随机化是控制无关变量影响的最简单、最有效的方法。通常指从总体中随机选择被试 被试随机分配到实验组和控制组:随机指派实验处理等。例如,用简单随机抽样从总体中抽 取被试100人,然后将这100个被试用抽签的方式随机分配到实验组和控制组,每组50人, 由同一教师采用两种不同的教学方法(自变量)进行教学实验,至于哪个组为实验组,哪个
5 用它能促使被试产生反应和变化。实验目的是看自变量的介入会引起被试什么反应和变化。 例如,要提高大班儿童学业成绩,就要主动采取措施,或使用新的教学方法,或改变学习的 环境,或重新选择学习材料,或变换教学的组织形式等,这些都可作为研究者操纵的自变量, 研究者通过操纵某个自变量看它是否会提高儿童的学业成绩。 一个自变量的实验称单因素实验,两个以上自变量的实验称多因素实验。自变量的变化 等级称为水平。如,课外作业时间与学习成绩的实验研究,课外作业时间是一个自变量,研 究中可将作业时间划分为四个等级,0.5 小时、1 小时、1.5 小时、2 小时,那么这个实验是 一个自变量,四种水平(或四种实验处理)的实验研究。一般来说,一个自变量至少有两种 水平,出现或不出现。儿童的年级可有三种水平:大班、中班、小班。儿童的家庭背景可分 为两种水平:城市的、农村的等。 自变量的操纵往往涉及实验处理的次数、强度、方式、程序、介入时间、延续时间等问 题,研究者应根据研究假设、实验设计的要求和实际情况进行考虑。 2.因变量的测定 因变量是研究者要观测的变量,是由自变量引起的在被试身上产生的反应变化,因变量 的变化依赖于自变量的变化,实验目的就是要通过因变量的测定来研究自变量与因变量之间 是否存在因果关系。因变量的一个重要特征是它可以通过直接或间接的方式被观察,被测量, 并且可以转化为数据形式。例如,测验分数,考试成绩、评定等级、反应时间、答题的正误 百分数等。 因变量的测定关键是要有测量的指标,测量指标涉及测量方法、工具、材料、次数、时 间、插入点的安排等。当然有现成的测验量表、客观性试题最好。一般选择测量指标应根据 研究假设、实验设计的特点,现有的测量工具、手段等作具体分析,可考虑以下几方面: ①敏感性 所选指标对自变量的变化有较高的分辨能力。如五分制评分与百分制评分, 百分制敏感性较高。 ②客观性 所选指标具有可靠性和准确性,指标的解释不以研究者或被试的主观意志为 转移。 ③稳定性 所选指标在重复测验中数值接近,能获得稳定一致的结果。 ④经济性 所选指标应观测方便,数据转换容易,能节省时间和精力。 总之,因变量的测定同因变量本身的复杂程度有关,同实验要求达到的精确程度有关, 同现有的测量工具、测量手段有关,同研究的定性定量水平有关。 3.无关变量的控制 无关变量是研究中除了自变量和因变量之外的一切变量,是与实 验目的无关的变量。由于无关变量会影响因变量的测定,会对判断自变量和因变量的因果关 系造成干扰,因此在实验设计时需要对其进行控制。控制无关变量是实验研究的一个关键问 题。 为了使自变量和因变量的对应关系显现出来,必须“净化”实验过程中的变量,也就是说 要把无关因素人为地控制起来,以免实验过程中变量相互混淆,无法判断因果关系。一般来 说对无关变量控制的程度越高,实验的可信度也越高。当然要完全彻底控制无关变量是办不 到的,因为在教育实验中无关因素非常之多,研究者难以一一加以控制,通常讲的控制是指 尽可能地将其中最明显的无关变量、对实验效果起重大影响的无关变量挑选出来,加以控制, 不对无关变量进行控制,实验结果便无法解释,会导致实验的失败。控制无关变量的方法有: ①随机化 随机化是控制无关变量影响的最简单、最有效的方法。通常指从总体中随机选择被试; 被试随机分配到实验组和控制组;随机指派实验处理等。例如,用简单随机抽样从总体中抽 取被试 100 人,然后将这 100 个被试用抽签的方式随机分配到实验组和控制组,每组 50 人, 由同一教师采用两种不同的教学方法(自变量)进行教学实验,至于哪个组为实验组,哪个
组为控制组,可通过投掷分币随机确定。随机化确保了研究对象的选择具有同等的机遇性 实验组与控制组具有同质性,这样可以控制来自很多方面的无关变量 ②消除 消除指设法将无关变量排除在实验之外,不让它参与到实验过程中来。如,性别可能会 影响因变量的测定,那么被试的选择可都选男性或都选女性。又如,在暗室、隔音室内进行 视听感觉的实验,这样可消除外界光线、噪声对视听感觉的干扰。消除是控制程度很高的控 制方法,但在教育实验中应用有限,因为采用消除往往会使实验情境与实际情境差距太大, 降低实验的生态效应 ③平衡 平衡指设实验组和控制组,将无关变量的影响平均分配到实验组和控制组中去,使各组 之间的差异尽可能相等。实验组是指接受实验处理的被试组:控制组又称对照组,指除了没 有接受实验处理外,其他条件与实验组相似的被试组。实验组和控制组的唯一区别就是实验 组接受实验处理,控制组没有。如,等组实验就是按平衡原理设计的,两个组除实验处理不 同外,其余条件均相等,做到两组基本同质,这样有些无关变量在实验一开始便得到控制 平衡在教育实验中被广泛地采用,因为其组织形式简单,因果关系明了,易为他人理解和接 受。但实验组和控制组往往只是某些方面达到一定程度的平衡,难以在各个方面均达到完全 平衡。 ④恒定 恒定指使某些因素在实验中保持恒常不变,把有些变量变为常量加以控制,使无关变量 的影响在实验过程中保持不变。如,要对某种教学方法的效果进行比较研究,为了防止教师 水平不同而给教学效果造成影响,可由同一位教师担任实验班和对照班的教学,使教师这一 因素恒定不变,使教师水平这一变量变为常量。另外所用教学时间也可使其恒常不变,即实 验班和对照班均采用相等的时间进行教学,布置相同的作业练习等 在教育实验中除教学环境等因素可在短时间内有限地恒定外,对其他无关变量的恒定很 难,因为教育实验往往周期较长,学生的知识水平、能力不断增长,教师的工作态度、教学 能力也在改变,对于这些因素是无法使其恒定不变的。 ⑤盲法 盲法是指在实验中,被试或主试不知道谁接受了实验处理,谁没有接受实验处理,甚至 不知道实验设计者真实意图的一种排除来自被试或主试主观态度影响的控制方法。盲法有单 盲和双盲之分,单盲法指被试不知道自己在参与实验或正在接受某种实验处理,双盲法指主 试和被试均不知道自己在参与实验或不知道谁接受实验处理。 采用盲法控制的目的是为了避免由于被试知道自己参与实验或了解实验真实意图而可 能作出的反常行为,如表现岀情绪高涨、加倍努力,或设法迎合硏究者的口味行事,从而影 响实验结果的可靠性。同样,当主试知道哪些被试在实验组,哪些被试在控制组,哪些被试 接受实验处理,哪些被试未接受实验处理,常会有意无意地给予某些暗示,赋予某种期望, 从而影响实验结果的客观性。 盲法控制的作用是使实验组和控制组的实验情境同一化,避免被试可能产生的霍桑效应 和主试可能产生的罗森塔尔效应(教师期望效应),以便准确地研究实验处理的真实效应 例如,多动症儿童药物疗效的实验研究,在一个班40个儿童中一半服药,为了避免被 试和主试了解实验意图可能产生的主观偏差,让一半儿童服治疗多动症的药片,另一半儿童 服安慰剂(维生素类药片),以控制实验情况。如果主试知道谁服了药谁服了安慰剂,这是 单盲。为了避免主试知道哪些儿童服药而产生的期望效应,研究者将每次服用的药片、安慰 剂包在药袋里,药袋上只写被试的姓名,由主试去分发,主试也不知谁服用什么药,这就是 双盲
6 组为控制组,可通过投掷分币随机确定。随机化确保了研究对象的选择具有同等的机遇性, 实验组与控制组具有同质性,这样可以控制来自很多方面的无关变量。 ②消除 消除指设法将无关变量排除在实验之外,不让它参与到实验过程中来。如,性别可能会 影响因变量的测定,那么被试的选择可都选男性或都选女性。又如,在暗室、隔音室内进行 视听感觉的实验,这样可消除外界光线、噪声对视听感觉的干扰。消除是控制程度很高的控 制方法,但在教育实验中应用有限,因为采用消除往往会使实验情境与实际情境差距太大, 降低实验的生态效应。 ③平衡 平衡指设实验组和控制组,将无关变量的影响平均分配到实验组和控制组中去,使各组 之间的差异尽可能相等。实验组是指接受实验处理的被试组;控制组又称对照组,指除了没 有接受实验处理外,其他条件与实验组相似的被试组。实验组和控制组的唯一区别就是实验 组接受实验处理,控制组没有。如,等组实验就是按平衡原理设计的,两个组除实验处理不 同外,其余条件均相等,做到两组基本同质,这样有些无关变量在实验一开始便得到控制。 平衡在教育实验中被广泛地采用,因为其组织形式简单,因果关系明了,易为他人理解和接 受。但实验组和控制组往往只是某些方面达到一定程度的平衡,难以在各个方面均达到完全 平衡。 ④恒定 恒定指使某些因素在实验中保持恒常不变,把有些变量变为常量加以控制,使无关变量 的影响在实验过程中保持不变。如,要对某种教学方法的效果进行比较研究,为了防止教师 水平不同而给教学效果造成影响,可由同一位教师担任实验班和对照班的教学,使教师这一 因素恒定不变,使教师水平这一变量变为常量。另外所用教学时间也可使其恒常不变,即实 验班和对照班均采用相等的时间进行教学,布置相同的作业练习等。 在教育实验中除教学环境等因素可在短时间内有限地恒定外,对其他无关变量的恒定很 难,因为教育实验往往周期较长,学生的知识水平、能力不断增长,教师的工作态度、教学 能力也在改变,对于这些因素是无法使其恒定不变的。 ⑤盲法 盲法是指在实验中,被试或主试不知道谁接受了实验处理,谁没有接受实验处理,甚至 不知道实验设计者真实意图的一种排除来自被试或主试主观态度影响的控制方法。盲法有单 盲和双盲之分,单盲法指被试不知道自己在参与实验或正在接受某种实验处理,双盲法指主 试和被试均不知道自己在参与实验或不知道谁接受实验处理。 采用盲法控制的目的是为了避免由于被试知道自己参与实验或了解实验真实意图而可 能作出的反常行为,如表现出情绪高涨、加倍努力,或设法迎合研究者的口味行事,从而影 响实验结果的可靠性。同样,当主试知道哪些被试在实验组,哪些被试在控制组,哪些被试 接受实验处理,哪些被试未接受实验处理,常会有意无意地给予某些暗示,赋予某种期望, 从而影响实验结果的客观性。 盲法控制的作用是使实验组和控制组的实验情境同—化,避免被试可能产生的霍桑效应 和主试可能产生的罗森塔尔效应(教师期望效应),以便准确地研究实验处理的真实效应。 例如,多动症儿童药物疗效的实验研究,在一个班 40 个儿童中一半服药,为了避免被 试和主试了解实验意图可能产生的主观偏差,让一半儿童服治疗多动症的药片,另一半儿童 服安慰剂(维生素类药片),以控制实验情况。如果主试知道谁服了药谁服了安慰剂,这是 单盲。为了避免主试知道哪些儿童服药而产生的期望效应,研究者将每次服用的药片、安慰 剂包在药袋里,药袋上只写被试的姓名,由主试去分发,主试也不知谁服用什么药,这就是 双盲
⑥统计处理 统计处理指用统计方法对实验数据作一些处理,以排除或削弱无关变量的影响。如测验 后去掉最高分或最低分,或以统计方法将实验组和控制组的数据平均化等。 以上控制方法在实际运用中都会有一定的限制,研究者应根据具体情况有选择地采用, 扬长避短,相互配合,达到控制无关变量,使其影响作用最小化的目的。 三、实验效度 实验效度指实验的有效性和真实程度。实验设计质量的优劣通常用实验效度来衡量。实 验效度包括两方面的内容:内在效度和外在效度。 1.内在效度 内在效度又称内部效度,指实验结果的解释能力和可靠性。即实验结果是否完全归因于 自变量的操纵,是否真实地反映了自变量和因变量的关系 内在效度与无关变量的控制有关。一个实验能有效地控制实验条件,能清楚地解释实验 结果,能合理地推论因果关系,其内在效度就高;反之,一个实验不能有效地控制实验条件, 不能清楚地解释实验结果,不能合理地推论因果关系,那么这个实验的内在效度就低。 影响实验内在效度的因素很多,概括起来大致有以下八种: ①实验过程中发生的偶然事件 ②被试身心的成熟程度 ③前测效应 ④测量手段、工具缺乏一致性; ⑤统计回归效应 ⑥被试选择的偏差 ⑦被试的流失 ⑧多种研究因素和条件的交互作用。 内在效度的获得取决于正确地选择实验变量,合理的实验设计,认识到影响内在效度的 各种因素,有效地控制无关变量等 2.外在效度 外在效度又称外部效度,指实验结果的推广能力和代表性。即实验结果能否运用于更大 范围,能否推广到同类事物和现象上去的程度。如果一个实验仅适用于实验实施的自身范围, 不能推广到总体范围中去,则表明其外在效度低;反之,当一个实验不仅适用于实验实施的 自身范围,还能推广到总体范围中去,那么这个实验的外在效度就高。 影响实验外在效度的因素概括起来大致有以下几种: ①测验的敏感性作用 ②被试取样不具代表性 ③实验安排的副效应; ④多重实验处理的干扰 外在效度的获得取决于被试取样的代表性,实验情境的现场化、生态化,以及对各种实 验效应的控制等 威尔斯曼(W. Wiersma)在《教育研究方法导论》一书中将影响实验内在效度和外在效 度的12种因素配上例子加以说明,见表61 表6一1影响实验内在效度和外在效度的例子
7 ⑥统计处理 统计处理指用统计方法对实验数据作一些处理,以排除或削弱无关变量的影响。如测验 后去掉最高分或最低分,或以统计方法将实验组和控制组的数据平均化等。 以上控制方法在实际运用中都会有一定的限制,研究者应根据具体情况有选择地采用, 扬长避短,相互配合,达到控制无关变量,使其影响作用最小化的目的。 三、实验效度 实验效度指实验的有效性和真实程度。实验设计质量的优劣通常用实验效度来衡量。实 验效度包括两方面的内容:内在效度和外在效度。 1.内在效度 内在效度又称内部效度,指实验结果的解释能力和可靠性。即实验结果是否完全归因于 自变量的操纵,是否真实地反映了自变量和因变量的关系。 内在效度与无关变量的控制有关。一个实验能有效地控制实验条件,能清楚地解释实验 结果,能合理地推论因果关系,其内在效度就高;反之,一个实验不能有效地控制实验条件, 不能清楚地解释实验结果,不能合理地推论因果关系,那么这个实验的内在效度就低。 影响实验内在效度的因素很多,概括起来大致有以下八种: ①实验过程中发生的偶然事件; ②被试身心的成熟程度; ③前测效应; ④测量手段、工具缺乏一致性; ⑤统计回归效应; ⑥被试选择的偏差; ⑦被试的流失; ⑧多种研究因素和条件的交互作用。 内在效度的获得取决于正确地选择实验变量,合理的实验设计,认识到影响内在效度的 各种因素,有效地控制无关变量等。 2.外在效度 外在效度又称外部效度,指实验结果的推广能力和代表性。即实验结果能否运用于更大 范围,能否推广到同类事物和现象上去的程度。如果一个实验仅适用于实验实施的自身范围, 不能推广到总体范围中去,则表明其外在效度低;反之,当一个实验不仅适用于实验实施的 自身范围,还能推广到总体范围中去,那么这个实验的外在效度就高。 影响实验外在效度的因素概括起来大致有以下几种: ①测验的敏感性作用; ②被试取样不具代表性; ③实验安排的副效应; ④多重实验处理的干扰。 外在效度的获得取决于被试取样的代表性,实验情境的现场化、生态化,以及对各种实 验效应的控制等。 威尔斯曼(W. Wiersma)在《教育研究方法导论》一书中将影响实验内在效度和外在效 度的 12 种因素配上例子加以说明,见表 6—1。 表 6 一 l 影响实验内在效度和外在效度的例子
干扰因素 举例 内在效度 1.偶然事件—一在实验进展过程中没有预料|1.在相对较短的教学实验中,一组被试因 到的影响因变量的事件的发生。 学校停电而不能对其进行教学 2.成熟程度一时间在被试身上起的作用。2.在学习实验中,被试者在50分钟后因疲 劳而成绩下降。 3.测验——一注意一次测验对随后另一次测验3.在一次以逻辑推理能力为因变量的实验 的影响 中前测给被试者提供了有关后测的线索。 4.测量手段一测量手段不统一会产生错4.两个主考人对同一项教学实验进行后测 误的结果 所用的程序和方法不同 5.统计回归——挑选被试的误差,比如用极5.在一项阅读教学的实验中,前测中阅读 端分数进行回归,将对今后的测验产生不利影成绩差组成的组,较之于成绩一般、好的组 进步大得多。 6.被试的选择差异—被试未能随机分配或|6.一个教学实验的实验组本来就是一个高 挑选,而其中一个因素起了作用从而产生了组材生班,而控制组则本来是一个普通水平 的不对等性 7.实验的偶然减员—一非随机挑选的被试脱7.在一项判断种类运动效果的健康实验中 离实验,会产生不良影响。 部分被试发现此项运动很难而退出。 8.取样一一成熟程度交互作用——由于取样|8.在一项问题的实验中,选取初、高中教 不一带来的成熟程度的不一致 学班为被试,初中生比高中生更早地感到疲 外在效应 1.测验的交互作用—前测与实验处理发生1.在一项体育表演实验中,前测为被试对 作用,并导致结果不能推广到未经过前测的群实验处理提供了以某种方式作出反应的暗 体中。 示,如果没有前测,则不会。 2.抽样偏差和实验处理的交互作用—一根据2.进行对教学方法作实验处理的用—一根 实验处理的需要而挑选现成班级进行实验,其据实验处理的需要而挑选现成班级进行实 结果不能推广 验,其结果不能推广。 3.实验安排的副效应—一被试知道他们要参|3.一项实习性的阅读教学实验产生的效果 加实验并对其具有新鲜感,也称为霍桑效应。不会在再以同样内容同样方式的正常补习 阅读教学中产生 4.多重处理干扰 个被试受两项或两项4.在一药物实验中,对同一动物依次给予4 以上的处理,(就像在重复测量中设计的那样)种不同的药物处理。从第2次到第4次服药 会产生一种后遗效应,导致不能推广到单独处的效果都摆脱不了第一次服药可能有的长 理中。 效影响。 3.内在效度和外在效度的关系 实验效度是每一个实验必须考虑的问题,实验效度只是程度的问题,效度不会全有或全 无。一般来说,内在效度越充分,结果推广度越大,研究越有价值。内在效度是实验质量的 根本保证,是外在效度的先决条件,没有内在效度便无所谓外在效度。但内在效度高的实验 并不一定具有较高的外在效度,二者往往难以都得到完全满足。有时确保了一种效度,就会 削弱另一种效度 例如,为了控制性别差异可能对实验结果的影响,只选取男孩或女孩作为被试,这时实
8 干 扰 因 素 举 例 内在效度 1.偶然事件——在实验进展过程中没有预料 到的影响因变量的事件的发生。 2.成熟程度——时间在被试身上起的作用。 3.测验——注意一次测验对随后另一次测验 的影响。 4.测量手段—一—测量手段不统一会产生错 误的结果。 5.统计回归——挑选被试的误差,比如用极 端分数进行回归,将对今后的测验产生不利影 响。 6.被试的选择差异——被试未能随机分配或 挑选,而其中一个因素起了作用从而产生了组 的不对等性。 7.实验的偶然减员——非随机挑选的被试脱 离实验,会产生不良影响。 8.取样一一成熟程度交互作用——由于取样 不一带来的成熟程度的不一致。 外在效应 1.测验的交互作用——前测与实验处理发生 作用,并导致结果不能推广到未经过前测的群 体中。 2.抽样偏差和实验处理的交互作用——根据 实验处理的需要而挑选现成班级进行实验,其 结果不能推广。 3.实验安排的副效应——被试知道他们要参 加实验并对其具有新鲜感,也称为霍桑效应。 4.多重处理干扰——一个被试受两项或两项 以上的处理,(就像在重复测量中设计的那样) 会产生—种后遗效应,导致不能推广到单独处 理中。 1.在相对较短的教学实验中,一组被试因 学校停电而不能对其进行教学。 2.在学习实验中,被试者在 50 分钟后因疲 劳而成绩下降。 3.在一次以逻辑推理能力为因变量的实验 中前测给被试者提供了有关后测的线索。 4.两个主考人对同一项教学实验进行后测 所用的程序和方法不同。 5.在一项阅读教学的实验中,前测中阅读 成绩差组成的组,较之于成绩一般、好的组 进步大得多。 6.一个教学实验的实验组本来就是一个高 材生班,而控制组则本来是一个普通水平 班。 7.在一项判断种类运动效果的健康实验中 部分被试发现此项运动很难而退出。 8.在一项问题的实验中,选取初、高中教 学班为被试,初中生比高中生更早地感到疲 劳。 1.在一项体育表演实验中,前测为被试对 实验处理提供了以某种方式作出反应的暗 示,如果没有前测,则不会。 2.进行对教学方法作实验处理的用——根 据实验处理的需要而挑选现成班级进行实 验,其结果不能推广。 3.一项实习性的阅读教学实验产生的效果 不会在再以同样内容同样方式的正常补习 阅读教学中产生。 4.在一药物实验中,对同一动物依次给予 4 种不同的药物处理。从第 2 次到第 4 次服药 的效果都摆脱不了第一次服药可能有的长 效影响。 3.内在效度和外在效度的关系 实验效度是每一个实验必须考虑的问题,实验效度只是程度的问题,效度不会全有或全 无。一般来说,内在效度越充分,结果推广度越大,研究越有价值。内在效度是实验质量的 根本保证,是外在效度的先决条件,没有内在效度便无所谓外在效度。但内在效度高的实验 并不一定具有较高的外在效度,二者往往难以都得到完全满足。有时确保了一种效度,就会 削弱另一种效度。 例如,为了控制性别差异可能对实验结果的影响,只选取男孩或女孩作为被试,这时实
验的内在效度提高了,但实验的外在效度受到损失,即实验结果难以推广到不问性别的群体 中去,结论的普遍适用性降低了。又如,在现场自然情境中进行一项实验,虽然能较好地适 用现实情境(具有较好的外在效度),但受实验条件限制,无法象实验室实验那样充分地控 制无关变量,实验的内在效度降低了 为此,在实验设计中要综合考虑内在效度和外在效度的平衡,在保证实验结果可靠性的 基础上,尽可能使研究获得更大的推广能力。 要提高实验效度,关键问题是要对影响效度的各种因素进行控制,通常普遍被运用的措 施有:设对照组控制、随机化控制、实验设计控制、统计处理控制等 第三节实验配组和实验设计类型 如何控制无关变量是实验研究中最棘手的问题。实验设计就是试图通过不同的配组形式 和不同的实验模式来达到控制无关变量的目的。 、实验配组 简单地说,实验配组就是指如何将被试分配到实验组和控制组中去。配组的基本要求是 尽可能使组与组之间等质,以避免被试的差异对实验结果的影响。为叙述方便,先引入几个 符号。 X表示实验处理或自变量 表示无实验处理 O表示实验观测,包括因变量的测定 G表示组,实验组或控制组 R表示被试已作随机分配 S表示被试 表示虚线上面和下面的组不是等组 另外,字母后下标的数字表示次数,如O1,表示观测1,O2表示观测2;X1表示实验 处理1,X2表示实验处理2 实验设计过程中,研究者必定要考虑:设多少实验组和控制组?如何选择被试?如何配 置各组被试?要解决以上问题,研究者首先要知道:自变量的数量是多少?每个自变量中包 含几种水平?实验是否需要设控制组?以及因变量测定的次数与程序安排?而这些问题实 际上都取决于实验的目的、要求,实验的假设。 1.完全随机设计 完全随机设计又称随机分组法,是用随机化的方法,随机分配被试给实验组和控制组。 从理论上说,每个组被试之间无差异。完全随机设计是一种比较方便的配组方法,无需事先 测试,适用被试较多,个体差异不大的情况。与此相应的分组方法还有抽签法、随机数字表 法,等距抽样法等。如,将学号尾数为5的学生作为实验组被试,学号尾数为8的学生作为 控制组被试 2.随机区组设计 随机区组设计是事先对被试进行测试,根据测试成绩将被试分成若干个同质的区组,然 后将每个区组内的被试随机分配给实验组和控制组。这种设计以测验成绩为依据,再行配组
9 验的内在效度提高了,但实验的外在效度受到损失,即实验结果难以推广到不问性别的群体 中去,结论的普遍适用性降低了。又如,在现场自然情境中进行一项实验,虽然能较好地适 用现实情境(具有较好的外在效度),但受实验条件限制,无法象实验室实验那样充分地控 制无关变量,实验的内在效度降低了。 为此,在实验设计中要综合考虑内在效度和外在效度的平衡,在保证实验结果可靠性的 基础上,尽可能使研究获得更大的推广能力。 要提高实验效度,关键问题是要对影响效度的各种因素进行控制,通常普遍被运用的措 施有:设对照组控制、随机化控制、实验设计控制、统计处理控制等。 第三节 实验配组和实验设计类型 如何控制无关变量是实验研究中最棘手的问题。实验设计就是试图通过不同的配组形式 和不同的实验模式来达到控制无关变量的目的。 一、实验配组 简单地说,实验配组就是指如何将被试分配到实验组和控制组中去。配组的基本要求是 尽可能使组与组之间等质,以避免被试的差异对实验结果的影响。为叙述方便,先引入几个 符号。 X 表示实验处理或自变量; — 表示无实验处理; O 表示实验观测,包括因变量的测定; G 表示组,实验组或控制组; R 表示被试已作随机分配; S 表示被试; …… 表示虚线上面和下面的组不是等组。 另外,字母后下标的数字表示次数,如 O1,表示观测 1,O2 表示观测 2;X1 表示实验 处理 l,X2 表示实验处理 2。 实验设计过程中,研究者必定要考虑:设多少实验组和控制组?如何选择被试?如何配 置各组被试?要解决以上问题,研究者首先要知道:自变量的数量是多少?每个自变量中包 含几种水平?实验是否需要设控制组?以及因变量测定的次数与程序安排?而这些问题实 际上都取决于实验的目的、要求,实验的假设。 1.完全随机设计 完全随机设计又称随机分组法,是用随机化的方法,随机分配被试给实验组和控制组。 从理论上说,每个组被试之间无差异。完全随机设计是一种比较方便的配组方法,无需事先 测试,适用被试较多,个体差异不大的情况。与此相应的分组方法还有抽签法、随机数字表 法,等距抽样法等。如,将学号尾数为 5 的学生作为实验组被试,学号尾数为 8 的学生作为 控制组被试。 2.随机区组设计 随机区组设计是事先对被试进行测试,根据测试成绩将被试分成若干个同质的区组,然 后将每个区组内的被试随机分配给实验组和控制组。这种设计以测验成绩为依据,再行配组
可保证实验组与控制组所处水平基本相同,精确程度比完全随机设计高。 例如,研究者考虑到这60名幼儿的智力可能会影响实验处理的效果,可先对幼儿进行 智力测验,然后根据测验分数将幼儿分成好、中、差三个同质的区组,人数分别为8、36 16,最后将每个区组内的被试随机分配给实验组和控制组。配组过程见图6-3。 随机分配 配组结果 0实验组 中 18 测验、 30控制组 图6-3随机区组设计配组示意图 与随机区组设计相似的分组方法还有测量分组法,其具体步骤是 ①对被试进行测试 ②按测试成绩高低排列 ⑧按排列顺序分组; ④检验各组平均数、标准差 ⑤用抽签法决定哪组为实验组,哪组为控制组。 在第③步按排列顺序分组,可以将被试测试成绩由高到低排列编号,然后将单号编入ˉ 组,双号编入另一组,最后随机决定实验组和控制组。分组排列顺序分组也可按另外一种形 式进行,见图64 分成两个等组 第 5 分成三个等组
10 可保证实验组与控制组所处水平基本相同,精确程度比完全随机设计高。 例如,研究者考虑到这 60 名幼儿的智力可能会影响实验处理的效果,可先对幼儿进行 智力测验,然后根据测验分数将幼儿分成好、中、差三个同质的区组,人数分别为 8、36、 16,最后将每个区组内的被试随机分配给实验组和控制组。配组过程见图 6—3。 图 6—3 随机区组设计配组示意图 与随机区组设计相似的分组方法还有测量分组法,其具体步骤是: ①对被试进行测试; ②按测试成绩高低排列; ⑧按排列顺序分组; ④检验各组平均数、标准差; ⑤用抽签法决定哪组为实验组,哪组为控制组。 在第③步按排列顺序分组,可以将被试测试成绩由高到低排列编号,然后将单号编入一 组,双号编入另一组,最后随机决定实验组和控制组。分组排列顺序分组也可按另外一种形 式进行,见图 6—4。 分成两个等组 第一组 1 4 5 8 9 12 13 第二组 2 3 6 7 10 11 14 分成三个等组 随机分配 配组结果 控制组 测验 实验组 60 18 8 8 18 4 4 16 36 8 30 30 好 中 差