第七章选择研究对象的方法 任何研究首先必须要有明确研究对象,然后才能根据研究对象收集资料。在教育研究中, 研究对象通常是人,如:学生、教师、家长等,当然,研究对象还可以是与教育有关的现象与 问题。 选择研究对象是教育研究设计的主要内容之一,它不仅与研究目的、内容密切相关,而且 还直接关系到资料的收集、整理、分析,同时它还涉及到整个研究的费用以及应用范围。一般 来说,如果研究对象仅仅是个别的或少数人,通常不存在抽样问题,因为研究对象的总体差不 多就是研究的直接对象。但是绝大多数研究课题设计的对象总体比较大,有时趋于无穷。要将 课题规定的所有对象都拿来进行研究往往是难以做到的,也没有必要,因此需要选择部分的研 究对象,这样的程序和方法,用一个专业术语表示就是“抽样 抽样的基本原理 抽样( Sampling)就是从一个总体( population)中抽取部分具有代表性的个体作为样本 sample),然后用这一样本的结果去推断总体。在这里,总体指研究对象的全体,样本是指从 总体中抽取的部分个体。 例如做汤,为了知道汤的咸淡,没有必要等到一锅汤喝完后再对汤的味道下结论,只需舀 勺汤品尝一下,然后根据尝的味道推断这锅汤的味道。在这里,一锅汤就是研究的的总体, 而这一勺汤则是从总体中选取得到的样本。又如,我们要了解上海市小学三年级学生的识字量 是多少?由于全市小学三年级学生数量巨大,不可能给每个学生都测量一下,研究只能在上海 市小学三年级学生总体中抽取部分个体对他们进行识字量测验,然后从得出的研究结果推断全 市小学生的识字量。假设上海市小学三年级学生总体为10000人,从中随机抽取样本1000人 并对这1000人进行识字量测试,获得结果为平均识字量1600字,然后根据测试结果推断上海 市小学三年级学生平均识字量为1600字左右。抽样的基本原理见下图: 随机抽样 样本 100000人 1000 研究结果 推断 图7-1抽样基本原理关系图 抽样是以概率论为理论基础。抽样的作用是为了合理地减少研究对象,既可以节约人力、 物力、时间,又可使研究力量相对集中,使研究工作深入、细致,从而提高研究的准确性和可 靠性。 般来说,定性研究中抽取的样本很小,样本有时仅仅是一个案例或一个个体,研究目的
第七章 选择研究对象的方法 任何研究首先必须要有明确研究对象,然后才能根据研究对象收集资料。在教育研究中, 研究对象通常是人,如:学生、教师、家长等,当然,研究对象还可以是与教育有关的现象与 问题。 选择研究对象是教育研究设计的主要内容之一,它不仅与研究目的、内容密切相关,而且 还直接关系到资料的收集、整理、分析,同时它还涉及到整个研究的费用以及应用范围。一般 来说,如果研究对象仅仅是个别的或少数人,通常不存在抽样问题,因为研究对象的总体差不 多就是研究的直接对象。但是绝大多数研究课题设计的对象总体比较大,有时趋于无穷。要将 课题规定的所有对象都拿来进行研究往往是难以做到的,也没有必要,因此需要选择部分的研 究对象,这样的程序和方法,用一个专业术语表示就是“抽样”。 一、抽样的基本原理 抽样(Sampling)就是从一个总体(population)中抽取部分具有代表性的个体作为样本 (sample),然后用这一样本的结果去推断总体。在这里,总体指研究对象的全体,样本是指从 总体中抽取的部分个体。 例如做汤,为了知道汤的咸淡,没有必要等到一锅汤喝完后再对汤的味道下结论,只需舀 一勺汤品尝一下,然后根据尝的味道推断这锅汤的味道。在这里,一锅汤就是研究的的总体, 而这一勺汤则是从总体中选取得到的样本。又如,我们要了解上海市小学三年级学生的识字量 是多少?由于全市小学三年级学生数量巨大,不可能给每个学生都测量一下,研究只能在上海 市小学三年级学生总体中抽取部分个体对他们进行识字量测验,然后从得出的研究结果推断全 市小学生的识字量。假设上海市小学三年级学生总体为 100000 人,从中随机抽取样本 1000 人, 并对这 1000 人进行识字量测试,获得结果为平均识字量 1600 字,然后根据测试结果推断上海 市小学三年级学生平均识字量为 1600 字左右。抽样的基本原理见下图: 随机抽样 研究结果 推断 图 7-1 抽样基本原理关系图 抽样是以概率论为理论基础。抽样的作用是为了合理地减少研究对象,既可以节约人力、 物力、时间,又可使研究力量相对集中,使研究工作深入、细致,从而提高研究的准确性和可 靠性。 一般来说,定性研究中抽取的样本很小,样本有时仅仅是一个案例或一个个体,研究目的 100000 人 样本 1000
是为了对所研究对象进行更深入的了解。而定量研究的样本数较大,样本可以是一群个体, 要考虑样本能否准确代表总体,能否对总体作出推断 抽样的基本要求 抽样是有一定规则的,抽样的基本要求是 1.总体范围的确定 抽样,首先要明确规定抽样的总体范围,一般来说,研究课题和硏究目的决定了总体的范 围。如,“上海市区初中学生身体素质的调查”这个课题的总体就是上海市区全体初一至初三的 中学生,不包括郊县的初中生。如果总体范围不很清楚,在抽样前应对总体做出明确的规定 否则,会对抽取样本和研究结果的推断造成麻烦。通常研究课题的确立就已基本框定了总体范 围,研究者要考虑的是为什么要确定该总体的理由,以及研究的预期效果和可行性问题 2.抽样的随机化 抽样要尽可能做到随机化( random)。随机化是指总体中的每个个体被选入样本的概率 ( probability)不为零。也就是说,总体中的每一个个体入选的机会均等。随机是科学研究的基 本原则。抽样的随机化是一种精确而科学的过程,是科学研究结果可靠性的保证,可以避免研 究者自觉或不自觉的偏见。抽签、摇奖就是根据抽样的随机化原理设计的。严格的抽样必须是 随机的,这样可避免研究者的主观倾向或人为因素造成的抽样偏差( sampling bias) 3.样本的代表性 样本的代表性指样本应具备总体的性质或特征,样本能在较大程度上代表总体。样本研究 的关键在于抽样和推论,抽样是推论的先决条件,样本的代表性会影响研究结论的可靠性和研 究结论的推断程度。代表性越高的样本,其研究结果的普遍性就越大:反之,如果样本没有代 表性往往会导致研究的失败。常为人引用的一个例子是:1936年美国的总统大选,当时美国的 《文学文摘》杂志曾做了一次关于总统大选的民意调查,调查结果预测兰登将在总统选举中获 胜,罗斯福落选。但事实正好相反,选举结果是罗斯福当选总统。虽然《文学文摘》杂志的民 意调查样本数很大,但调查者的样本是从电话号簿和汽车登记册中抽取的。1936年正是美国经 济大萧条过后,有汽车有电话的人仅代表了美国选民中的某个特定阶层,对于选民总体来说不 具备代表性。这次民意调查的失败主要在于抽样偏差,样本没有代表性,抽取的样本在质上与 总体特征不相吻合。 与此同时,盖洛普民意调查所也作了总统大选的调查,只发了2000份问卷,结果预测成功, 罗斯福当选总统。后来盖洛普嘲笑《文学文摘》杂志说:“用两匹马来拉的车,用50匹马来拉 是无用的。” 4.合理的样本容量 样本容量又称样本大小,是指抽取样本的具体数量。样本数量的多少是研究无法回避的问 题,是研究设计中重要的一环,也是比较困难的一件事。它既要符合研究目的、内容,满足教 育统计的要求,又要考虑抽样的可能性,并使误差减少到最低限度。一般来说,样本数越多, 代表性越好,但是增大样本,势必増加研究的人力、物力、财力,增加硏究的难度,造成不必 要的浪费。如果样本数太小,则抽样误差较大,样本不能代表总体,不利于统计分析,影响研 究效果。样本数量究竟多少为宜,这是一个复杂的问题。我们很难说出一个确定的数字,样本 数量要从多个方面综合起来考虑。一般来说,样本容量大小取决于以下一些因素 (1)研究的类型、范围 当研究是定量研究,研究范围较广,样本数量可适当大一些:反之,当研究是定性硏究, 研究范围较狭窄,样本数量可适当少一些 (2)研究分析的精确程度 当研究要求有较高的统计显著程度,具有较高的可信程度时,样本数量可多些:反之,则 可少些 (3)允许误差的大小 当研究允许的误差值小,要求的可信程度高,所需样本容量相应要大;反之,则可小些
是为了对所研究对象进行更深入的了解。而定量研究的样本数较大,样本可以是一群个体,并 要考虑样本能否准确代表总体,能否对总体作出推断。 二、抽样的基本要求 抽样是有一定规则的,抽样的基本要求是: 1.总体范围的确定 抽样,首先要明确规定抽样的总体范围,一般来说,研究课题和研究目的决定了总体的范 围。如,“上海市区初中学生身体素质的调查”这个课题的总体就是上海市区全体初一至初三的 中学生,不包括郊县的初中生。如果总体范围不很清楚,在抽样前应对总体做出明确的规定。 否则,会对抽取样本和研究结果的推断造成麻烦。通常研究课题的确立就已基本框定了总体范 围,研究者要考虑的是为什么要确定该总体的理由,以及研究的预期效果和可行性问题。 2.抽样的随机化 抽样要尽可能做到随机化(random)。随机化是指总体中的每个个体被选入样本的概率 (probability)不为零。也就是说,总体中的每一个个体入选的机会均等。随机是科学研究的基 本原则。抽样的随机化是一种精确而科学的过程,是科学研究结果可靠性的保证,可以避免研 究者自觉或不自觉的偏见。抽签、摇奖就是根据抽样的随机化原理设计的。严格的抽样必须是 随机的,这样可避免研究者的主观倾向或人为因素造成的抽样偏差(sampling bias)。 3.样本的代表性 样本的代表性指样本应具备总体的性质或特征,样本能在较大程度上代表总体。样本研究 的关键在于抽样和推论,抽样是推论的先决条件,样本的代表性会影响研究结论的可靠性和研 究结论的推断程度。代表性越高的样本,其研究结果的普遍性就越大;反之,如果样本没有代 表性往往会导致研究的失败。常为人引用的一个例子是:1936 年美国的总统大选,当时美国的 《文学文摘》杂志曾做了一次关于总统大选的民意调查,调查结果预测兰登将在总统选举中获 胜,罗斯福落选。但事实正好相反,选举结果是罗斯福当选总统。虽然《文学文摘》杂志的民 意调查样本数很大,但调查者的样本是从电话号簿和汽车登记册中抽取的。1936 年正是美国经 济大萧条过后,有汽车有电话的人仅代表了美国选民中的某个特定阶层,对于选民总体来说不 具备代表性。这次民意调查的失败主要在于抽样偏差,样本没有代表性,抽取的样本在质上与 总体特征不相吻合。 与此同时,盖洛普民意调查所也作了总统大选的调查,只发了 2000 份问卷,结果预测成功, 罗斯福当选总统。后来盖洛普嘲笑《文学文摘》杂志说:“用两匹马来拉的车,用 50 匹马来拉 是无用的。” 4.合理的样本容量 样本容量又称样本大小,是指抽取样本的具体数量。样本数量的多少是研究无法回避的问 题,是研究设计中重要的一环,也是比较困难的一件事。它既要符合研究目的、内容,满足教 育统计的要求,又要考虑抽样的可能性,并使误差减少到最低限度。一般来说,样本数越多, 代表性越好,但是增大样本,势必增加研究的人力、物力、财力,增加研究的难度,造成不必 要的浪费。如果样本数太小,则抽样误差较大,样本不能代表总体,不利于统计分析,影响研 究效果。样本数量究竟多少为宜,这是一个复杂的问题。我们很难说出一个确定的数字,样本 数量要从多个方面综合起来考虑。一般来说,样本容量大小取决于以下一些因素: (1)研究的类型、范围 当研究是定量研究,研究范围较广,样本数量可适当大一些;反之,当研究是定性研究, 研究范围较狭窄,样本数量可适当少一些。 (2)研究分析的精确程度 当研究要求有较高的统计显著程度,具有较高的可信程度时,样本数量可多些;反之,则 可少些。 (3)允许误差的大小 当研究允许的误差值小,要求的可信程度高,所需样本容量相应要大;反之,则可小些
表7-1表示当总体趋于无限大时,不同的允许误差和可信程度要求不同的样本数量 表7-1允许误差和可信程度与样本容量关系表① 允许误差 99% 1% 9604 16587 4147 3% 1067 1843 384 7% 196 339 (4)总体的同质性 当总体的变异性比较大,变量的相关程度比较低,研究的条件控制不严格,样本数量可适 当增加些;反之,当总体同质性比较好,变量的相关程度较高,研究条件控制严格,则可少些。 如,人的血液同质性比较好,医院化验只需抽取一点点血。学生的智力、能力变异性比较大 因此抽取样本相对比较大。 (5)测量工具的可靠程度 当测量工具的可靠程度即测定指标信度比较低时,测量的误差就比较大,这时需要增大样 本数量:反之,则可减少样本数量。一般说来,有关学习能力和成就的测量工具可靠性程度好 些,有关人格特质、自我概念、态度等方面的测量工具可靠程度差些。 (6)研究的成本 研究的成本包括经费、时间、人力、物力,抽样数量总是要控制在研究成本允许的范围内 因此,确定样本容量时,必须仔细分析研究的条件,量体裁衣。 (7)分析的类别 当研究的关系复杂,分析的项目较多,那么样本数量可多些;反之,则可少些。一般应保 证每一分析小类的样本数量不少于10。 以上七个方面都是原则性的意见,可作为决定样本容量大小的参考依据。下面根据实际经 验提供一些可参照的数据: 教育硏究中的调查或描述现状的研究,样本数量最好不要少于100: 相关性研究中,样本数量最好不少于30 实验研究中,每组样本数量最好不少于30 全国性的调查,样本数量控制在15002500之间 地区性的调查,样本数量控制在500-1000之间 当然,以上给出的数字仅仅供参考,在研究中具体样本数为多少,还需根据实际情况作出 决定。对于初学者,不妨先查看有关文献中的同类研究,别人的样本数量是多少以作为参照 另外,我们还可以根据推算样本数量的公式计算出总体数量与样本数量的参照数据,见表7-2 ①转引自袁方主编:《社会研究方法教程》北京大学出版社,1997年,第225页
表 7-1 表示当总体趋于无限大时,不同的允许误差和可信程度要求不同的样本数量。 表 7-1 允许误差和可信程度与样本容量关系表① 可 信 程 度 允许误差 95% 99% 1% 9604 16587 2% 2401 4147 3% 1067 1843 4% 600 1037 5% 384 663 6% 267 461 7% 196 339 (4)总体的同质性 当总体的变异性比较大,变量的相关程度比较低,研究的条件控制不严格,样本数量可适 当增加些;反之,当总体同质性比较好,变量的相关程度较高,研究条件控制严格,则可少些。 如,人的血液同质性比较好,医院化验只需抽取一点点血。学生的智力、能力变异性比较大, 因此抽取样本相对比较大。 (5)测量工具的可靠程度 当测量工具的可靠程度即测定指标信度比较低时,测量的误差就比较大,这时需要增大样 本数量;反之,则可减少样本数量。一般说来,有关学习能力和成就的测量工具可靠性程度好 些,有关人格特质、自我概念、态度等方面的测量工具可靠程度差些。 (6)研究的成本 研究的成本包括经费、时间、人力、物力,抽样数量总是要控制在研究成本允许的范围内。 因此,确定样本容量时,必须仔细分析研究的条件,量体裁衣。 (7)分析的类别 当研究的关系复杂,分析的项目较多,那么样本数量可多些;反之,则可少些。一般应保 证每一分析小类的样本数量不少于 10。 以上七个方面都是原则性的意见,可作为决定样本容量大小的参考依据。下面根据实际经 验提供一些可参照的数据: 教育研究中的调查或描述现状的研究,样本数量最好不要少于 100; 相关性研究中,样本数量最好不少于 30; 实验研究中,每组样本数量最好不少于 30; 全国性的调查,样本数量控制在 1500—2500 之间; 地区性的调查,样本数量控制在 500—1000 之间。 当然,以上给出的数字仅仅供参考,在研究中具体样本数为多少,还需根据实际情况作出 决定。对于初学者,不妨先查看有关文献中的同类研究,别人的样本数量是多少以作为参照。 另外,我们还可以根据推算样本数量的公式计算出总体数量与样本数量的参照数据,见表 7-2 ① 转引自袁方主编:《社会研究方法教程》北京大学出版社,1997 年,第 225 页
表7-2有限总体数量与样本数量关系表 总体数(N)10205000200500100200050001000000 样本数(n)10195080133217278322357370382384 注:可信度为95%,允许误差5% 从总体与样本数量的关系表中可以发现,样本数并不是随总体数量的增加而同步增加的。 当总体数量不断增加,样本数量的增长逐步减缓,在总体数量与样本数量曲线图上呈一条负加 速的增长曲线。见图7-2 样本数(n) 总体数(N) 图72有限总体数量与样本数量关系曲线示意图 由此可见,当总体大于1000,接近无限总体时,样本数量的增长微乎其微,在曲线图上几乎 就是平走。 三、抽样的基本过程 抽样的基本过程从研究设计考虑抽取研究对象开始,到完成抽样获得实际样本为止,大约 经历以下四个操作步骤 1、研究对象或理论总体 总体就是研究对象的全部。课题确立时的总体往往是虚拟的,是理论上的总体。如,进行 项有关10岁儿童生长发育的研究,如果期望以研究结果解释全世界的10岁儿童,那么理论 总体就是全世界10岁儿童;如果期望以研究结果解释全中国的10岁儿童,那么理论总体就是 全中国的10岁儿童:如果期望以研究结果解释上海市的10岁儿童,那么理论总体就是上海市 10岁儿童:如果期望以研究结果解释某一学校的10岁儿童,那么理论总体就是某校的10岁儿 童。由此可知,总体的范围可大可小,由研究者依据研究目的自行界定。如何界定总体可以参 考以下几点 (1)考虑并说明采用“特定群体”为总体的理由(为什么?理由何在?) (2)考虑并说明不采用“其他群体”为总体的理由(为什么?理由何在? (3)考虑研究的预期效果(结果的推广程度) (4)考虑研究的可行性(研究的必要条件)
表 7-2 有限总体数量与样本数量关系表 总体数(N)10 20 50 100 200 500 1000 2000 5000 10000 50000 100000 样本数(n) 10 19 50 80 133 217 278 322 357 370 382 384 注:可信度为 95%,允许误差 5% 从总体与样本数量的关系表中可以发现,样本数并不是随总体数量的增加而同步增加的。 当总体数量不断增加,样本数量的增长逐步减缓,在总体数量与样本数量曲线图上呈一条负加 速的增长曲线。见图 7-2 样本数(n) 总体数(N) 图 7-2 有限总体数量与样本数量关系曲线示意图 由此可见,当总体大于 10000,接近无限总体时,样本数量的增长微乎其微,在曲线图上几乎 就是平走。 三、抽样的基本过程 抽样的基本过程从研究设计考虑抽取研究对象开始,到完成抽样获得实际样本为止,大约 经历以下四个操作步骤: 1、 研究对象或理论总体 总体就是研究对象的全部。课题确立时的总体往往是虚拟的,是理论上的总体。如,进行 一项有关 10 岁儿童生长发育的研究,如果期望以研究结果解释全世界的 10 岁儿童,那么理论 总体就是全世界 10 岁儿童;如果期望以研究结果解释全中国的 10 岁儿童,那么理论总体就是 全中国的 10 岁儿童;如果期望以研究结果解释上海市的 10 岁儿童,那么理论总体就是上海市 10 岁儿童;如果期望以研究结果解释某一学校的 10 岁儿童,那么理论总体就是某校的 10 岁儿 童。由此可知,总体的范围可大可小,由研究者依据研究目的自行界定。如何界定总体可以参 考以下几点: (1)考虑并说明采用“特定群体”为总体的理由(为什么?理由何在?) (2)考虑并说明不采用“其他群体”为总体的理由(为什么?理由何在?) (3)考虑研究的预期效果(结果的推广程度) (4)考虑研究的可行性(研究的必要条件)
2、可获得总体或抽样框架 理论总体往往是虚的,不是一个实在的、可操作的总体。而可获得总体则是实在的、具体 的、可操作的总体。抽样框架是抽样单位的实际名单,样本就是从抽样框架中选取。如果一个 学生样本是从学校的学生花名册中抽选,这个花名册就是抽样框架。比较复杂的抽样,抽样框 架可以有不同的层次。如先抽取不同类型的学校,然后再从学校花名册抽取个体。通常确定课 题基本上规定了硏究的总体,根据这个总体再去寻找可能的抽样框架,然后对这个抽样框架进 行检验和评估,看这个抽样框架是否符合研究要求 3、选择样本 选择样本是指通过抽样方法得到的样本数量,是被选取参与研究的人员。这个样本数量只 是理想上的数量 4、实际样本 实际样本是指实际参与研究的样本数量。如果进行问卷调查的话,实际样本相当于回收问 卷的数量 例如,我们要对当前高中教师的教学理念的变化进行调查,理论总体是上海市所有高中教 师,可获得总体是某个区的高中教师,抽样框架为该区的高中教师2000人,选择样本为300人, 而实际样本即实际参与研究的教师为270人 在实际社会科学研究中,总体与抽样框架的问题并未引起重视,一般来说,根据样本所得 的研究成果只能代表组成抽样框架的总体,只能推断组成抽样框架的总体 在抽样过程中,确定样本的大小是一件重要的事,也是一件相当困难的事。样本太小,不 能代表总体,也不利于统计分析;可是一旦增大样本,势必增加收集资料所需的人力、物力 以及时间等资源,而且庞大资料的整理与分析也较困难。研究者必须在两难中作出决断 博格( Borg)与高尔(M、D、Gall)建议,在下列情况下要有较大的样本 1、研究中有较多的变量未于控制时 2、预期效果可能由于研究变量的性质而较不明确时 3、当研究样本必须再细分为次项目来分析时 4、当预期会有较多被试退出研究时 5、当总体的异质性较大时 6、当测量工具的可靠程度较低时 7、当期望有较高的统计显著性或统计鉴定力 一般来说,样本容量不如样本的准确性重要,即使样本容量很大,如果选择不当,也会得 出无效结论,因此谨慎抽样比增加样本容量更重要 哈佛大学教育研究院的莱特( RJ. Light)等人以预设的的统计鉴定力来表示进行研究时所 需要的样本人数,见下表 表7-3以统计鉴定力推估样本人数表 预期效果大小 研究类型统计检验方法统计鉴定力小中 大 相关研究 积差相关 1047 616 67 23 实验研究或 t检验 170 事后回溯研究 620 100 注:统计显著性程度为5%
2、 可获得总体或抽样框架 理论总体往往是虚的,不是一个实在的、可操作的总体。而可获得总体则是实在的、具体 的、可操作的总体。抽样框架是抽样单位的实际名单,样本就是从抽样框架中选取。如果一个 学生样本是从学校的学生花名册中抽选,这个花名册就是抽样框架。比较复杂的抽样,抽样框 架可以有不同的层次。如先抽取不同类型的学校,然后再从学校花名册抽取个体。通常确定课 题基本上规定了研究的总体,根据这个总体再去寻找可能的抽样框架,然后对这个抽样框架进 行检验和评估,看这个抽样框架是否符合研究要求。 3、 选择样本 选择样本是指通过抽样方法得到的样本数量,是被选取参与研究的人员。这个样本数量只 是理想上的数量。 4、 实际样本 实际样本是指实际参与研究的样本数量。如果进行问卷调查的话,实际样本相当于回收问 卷的数量。 例如,我们要对当前高中教师的教学理念的变化进行调查,理论总体是上海市所有高中教 师,可获得总体是某个区的高中教师,抽样框架为该区的高中教师 2000 人,选择样本为 300 人, 而实际样本即实际参与研究的教师为 270 人。 在实际社会科学研究中,总体与抽样框架的问题并未引起重视,一般来说,根据样本所得 的研究成果只能代表组成抽样框架的总体,只能推断组成抽样框架的总体。 在抽样过程中,确定样本的大小是一件重要的事,也是一件相当困难的事。样本太小,不 能代表总体,也不利于统计分析;可是一旦增大样本,势必增加收集资料所需的人力、物力、 以及时间等资源,而且庞大资料的整理与分析也较困难。研究者必须在两难中作出决断。 博格(W、R、Borg)与高尔(M、D、Gall)建议,在下列情况下要有较大的样本: 1、研究中有较多的变量未于控制时 2、预期效果可能由于研究变量的性质而较不明确时 3、当研究样本必须再细分为次项目来分析时 4、当预期会有较多被试退出研究时 5、当总体的异质性较大时 6、当测量工具的可靠程度较低时 7、当期望有较高的统计显著性或统计鉴定力时 一般来说,样本容量不如样本的准确性重要,即使样本容量很大,如果选择不当,也会得 出无效结论,因此谨慎抽样比增加样本容量更重要。 哈佛大学教育研究院的莱特(R.J.Light)等人以预设的的统计鉴定力来表示进行研究时所 需要的样本人数,见下表: 表 7-3 以统计鉴定力推估样本人数表 预期效果大小 研究类型 统计检验方法 统计鉴定力 小 中 大 相关研究 积差相关 .90 1047 113 87 .80 783 85 28 .70 616 67 23 实验研究或 t 检验 .90 1052 170 68 事后回溯研究 .80 786 128 52 .70 620 100 40 注:统计显著性程度为 5%
(引自吴明清:《教育研究一一基本观念与方法分析》五南图书出版公司,1991年,第231页) 表中左栏是研究方法的类型;表的第二栏是统计方法;第三栏是统计鉴定力,分为90、80、70 三个层次,研究者可以自行决定一个层次,鉴定力越大表示研究者期望辨识研究效果的可能性 越大:最后一栏是预期的效果大小,包括小、中、大三个层次,研究者必须依据理论、经验、 以及先前类似研究的结果来判断并决定。 例如,要比较12岁女生与18岁女生的身高差异时,我们判断其效果大小应属于“大效果”, 因为经验上这两类女生的身高有相当大的差异;如果比较15岁女生和8岁女生的身高差异 属于“中效果”;若比较17岁女生与18岁女生的身高差异,应属于“小效果”。如果以相关系 数表示效果大小,那么相关系数在1左右属于“小效果”,相关系数在3左右属“中效果”,相 关系数在5以上者属“大效果”。从两组平均数差异来看效果大小,差异在20个标准差者为“小 效果”,在.50个标准差者为“中效果”,在80个标准差者为“大效果” 如果我们要进行一项两种不同教学方法的比较实验研究,看哪种教学法法效果好。首先, 我们确定这是一个比较两组平均数差异(实验组与控制组之间差异)的研究:其次,我们设定 统计鉴定力为90(我们期望有较大的可能性确定研究效果):并且进一步判断这类研究的效果 应属于“大效果”(容易显示效果)。根据以上判断,从表上找到样本人数为68人,即实验组要 有34人,控制组要有34人。如果将统计鉴定力降为80,则样本人数为52人,如果将统计鉴 定力再降为70,则样本人数为40人。为了保证研究结果能在统计分析中明显显示,在实际研 究中,样本数最好不要少于表中规定的人数。 四、抽样的具体方法 教育研究一般都从总体中抽取一小部分个体作为收集资料的直接对象,这一小部分对象即 为“样本”。抽取样本进行研究,不但节省人力物力,也缩短资料取得与整理的时间,故成为教 育研究的主要方式 抽样的具体方法多种多样,抽样的方法可以分为两大类:概率抽样和非概率抽样。 概率抽样( probability sampling)是以“概率”为基础的抽样方法,它的核心技术为“随机样本 主要抽样方法有:简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样等。概率抽样 样本具有代表性,可以作推论,常用于正式的、量化的研究。 非概率抽样(non- probability sampling)是根据研究者的主观判断、或根据客观条件的方便 来抽样,不涉及概率原则。主要抽样方法有:方便抽样、目的抽样等。非概率抽样不具代表性 通常不能推断总体,常用于非正式的、质化的研究。 1.概率抽样 概率抽样就是研究总体中每个个体被抽取的概率是已知的,抽样方式是随机的。概率抽样常 用于定量研究或大规模的正式研究中。具体的抽样方法有: (1)简单随机抽样 简单随机抽样是概率抽样中最基本的,运用最广泛的抽样方法。它简便易行,是其他抽样 方法的基础。简单随机抽样总体中的每一个体都有被抽到的冋等机会,可通过抽签、随机数字 表或摇号机摇号等来实现抽样。 抽签。先给总体中的每个个体编上号码,每个号码做一个签,将全部的签充分混和后, 随机从中抽取,被抽到签号的个体进入样本,直到取够所需样本数目为止。例如总体共50人, 要抽取样本10人。我们先给总体编号,从1-50,然后随机抽10个号,抽中号的个体即作为样 本。简单随机抽样见下图:
(引自吴明清:《教育研究——基本观念与方法分析》五南图书出版公司,1991 年,第 231 页) 表中左栏是研究方法的类型;表的第二栏是统计方法;第三栏是统计鉴定力,分为.90、.80、.70 三个层次,研究者可以自行决定一个层次,鉴定力越大表示研究者期望辨识研究效果的可能性 越大;最后一栏是预期的效果大小,包括小、中、大三个层次,研究者必须依据理论、经验、 以及先前类似研究的结果来判断并决定。 例如,要比较 12 岁女生与 18 岁女生的身高差异时,我们判断其效果大小应属于“大效果”, 因为经验上这两类女生的身高有相当大的差异;如果比较 15 岁女生和 8 岁女生的身高差异,则 属于“中效果”;若比较 17 岁女生与 18 岁女生的身高差异,应属于“小效果”。如果以相关系 数表示效果大小,那么相关系数在.1 左右属于“小效果”,相关系数在.3 左右属“中效果”,相 关系数在.5 以上者属“大效果”。从两组平均数差异来看效果大小,差异在.20 个标准差者为“小 效果”,在.50 个标准差者为“中效果”,在.80 个标准差者为“大效果”。 如果我们要进行一项两种不同教学方法的比较实验研究,看哪种教学法法效果好。首先, 我们确定这是一个比较两组平均数差异(实验组与控制组之间差异)的研究;其次,我们设定 统计鉴定力为.90(我们期望有较大的可能性确定研究效果);并且进一步判断这类研究的效果 应属于“大效果”(容易显示效果)。根据以上判断,从表上找到样本人数为 68 人,即实验组要 有 34 人,控制组要有 34 人。如果将统计鉴定力降为.80,则样本人数为 52 人,如果将统计鉴 定力再降为.70,则样本人数为 40 人。为了保证研究结果能在统计分析中明显显示,在实际研 究中,样本数最好不要少于表中规定的人数。 四、抽样的具体方法 教育研究一般都从总体中抽取一小部分个体作为收集资料的直接对象,这一小部分对象即 为“样本”。抽取样本进行研究,不但节省人力物力,也缩短资料取得与整理的时间,故成为教 育研究的主要方式。 抽样的具体方法多种多样,抽样的方法可以分为两大类:概率抽样和非概率抽样。 概率抽样(probability sampling)是以“概率”为基础的抽样方法,它的核心技术为“随机样本”。 主要抽样方法有:简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样等。概率抽样 样本具有代表性,可以作推论,常用于正式的、量化的研究。 非概率抽样(non-probability sampling)是根据研究者的主观判断、或根据客观条件的方便 来抽样,不涉及概率原则。主要抽样方法有:方便抽样、目的抽样等。非概率抽样不具代表性, 通常不能推断总体,常用于非正式的、质化的研究。 1.概率抽样 概率抽样就是研究总体中每个个体被抽取的概率是已知的,抽样方式是随机的。概率抽样常 用于定量研究或大规模的正式研究中。具体的抽样方法有: (1)简单随机抽样 简单随机抽样是概率抽样中最基本的,运用最广泛的抽样方法。它简便易行,是其他抽样 方法的基础。简单随机抽样总体中的每一个体都有被抽到的同等机会,可通过抽签、随机数字 表或摇号机摇号等来实现抽样。 抽签。 先给总体中的每个个体编上号码,每个号码做一个签,将全部的签充分混和后, 随机从中抽取,被抽到签号的个体进入样本,直到取够所需样本数目为止。例如总体共 50 人, 要抽取样本 10 人。我们先给总体编号,从 1-50,然后随机抽 10 个号,抽中号的个体即作为样 本。简单随机抽样见下图:
可获得总体 样本 样本举例 2345678910随机抽取10个 l1121314151617181920 21222324252627282930 37,39,40,41, 11424344454647484950 图7-3简单随机抽样示意图 随机数字表随机数字表是由许多随机组合排列的数字组成的表(见表7-4),用它可以进行 简单随机抽样。 复印表7-4随机数字表
可获得总体 样本 样本举例 1 2 3 4 5 6 7 8 9 10 随机抽取 10 个 11 12 13 14 15 16 17 18 19 20 3,22,23,29, 21 22 23 24 25 26 27 28 29 30 37,39,40,41, 31 32 33 34 35 36 37 38 39 40 45,50 41 42 43 44 45 46 47 48 49 50 图 7-3 简单随机抽样示意图 随机数字表 随机数字表是由许多随机组合排列的数字组成的表(见表 7-4 ),用它可以进行 简单随机抽样。 复印表 7-4 随机数字表
例如要从总体800人中抽取100人的样本,先给800人从001-800编号,然后从随机数字 表中任何一行,任何一列的任何数字开始,按任意方向依次取三位数(由于本例个体编号为三 位数),凡是碰到001-800范围内的数字即为中选的号,直至取足T00个号为止。其中如果某号 大于800或已被抽取过再次出现,则跳过不算。例如从表7-4随机数字表第18行,第1列开 始向右取三位数,803(略去,因为超过800),270,267,198,191,843(略去),429,081 49,268.…直到抽足100个号为止。这100个号的被试就构成了该研究所需的样本 另外,功能较全的计算器都编有随机数字程序,可利用计算器的这一功能进行随机抽样, 以卡西欧(CASI0)fx-3600型计算器为例,操作过程为:开机后,按IN键和.键,显示屏 上出现三位小数,这三位小数就是随机数字,不断地重复按INV键和.键,显示屏上就会不断地 出现随机数字。用计算器随机抽取样本的基本程序与随机数字表的基本程序一样,直到取足样 本为止 (2)系统随机抽样 系统随机抽样又称等距抽样或杋械抽样,是把总体中的所有个体按某一顺序排列编号,然 后依固定的间隔抽取样本。先随机确定第一个样本数后,根据样本与总体的比例,每间隔n个 数抽取一个。例如,要从800名学生中抽取100人作为被试,先将被试按序编号,再按公式计 算抽样间隔的数字:800÷100=8,再从1-8中随机选定一个数字,假定为6,那么编号6,14 22,,30,38,46...798这100个号码的被试构成了系统随机抽样的样本 系统随机抽样使样本分配均衡,更具代表性,抽样误差较简单随杋抽样小,操作也较简单 实际应用较广。系统随机抽样见下图: 可获得总体 样本 样本举例 2345678910随机开始后 1121314151617181920每5个抽13,8,13,18 212223242526272829 13233343536373839 1424344454647484950 图7-4系统随机抽样示意图 (3)分层随机抽样 分层随机抽样又称分类抽样或配额抽样,是将总体按某一标准分成若干层次或类别(子总 体),然后以各层或各类在总体中所占比重,按比例随机抽取样本。例如对某校800个学生进行 学习态度的调查,拟抽取十分之二的学生(160人)作为样本。首先按成绩评定标准将学生分 成优、良、中、差四层,优(160人),良(320人),中(240人),差(80人)。然后用简单随 机抽样在这四层中按比例分别抽取样本,从优等中抽取160x2/10=32人:从良等中抽取320x 2/10=64人:从中等中抽取240x2/10=48人:从差等中抽取80x2/10=16人。这160人组成了 分层随机抽样的样本。 分层随机抽样确保每层子总体都被包容在抽样范围内,避免了某一子总体出现“超载”现 象或出现意外样本。对于总体构成比较复杂,同质性程度不高,总体数量较大,各层次标志比 较明显的情况下,宜采用分层随机抽样。分层随机抽样见下图
例如要从总体 800 人中抽取 100 人的样本,先给 800 人从 001-800 编号,然后从随机数字 表中任何一行,任何一列的任何数字开始,按任意方向依次取三位数(由于本例个体编号为三 位数),凡是碰到 001-800 范围内的数字即为中选的号,直至取足 100 个号为止。其中如果某号 大于 800 或已被抽取过再次出现,则跳过不算。例如从表 7-4 随机数字表第 18 行,第 1 列开 始向右取三位数,803(略去,因为超过 800),270, 267,198,191,843(略去),429,081, 349,268……直到抽足 100 个号为止。这 100 个号的被试就构成了该研究所需的样本。 另外,功能较全的计算器都编有随机数字程序,可利用计算器的这一功能进行随机抽样。 以卡西欧(CASIO)fx-3600 型计算器为例,操作过程为:开机后,按 INV 键和 .键,显示屏 上出现三位小数,这三位小数就是随机数字,不断地重复按 INV 键和 .键,显示屏上就会不断地 出现随机数字。用计算器随机抽取样本的基本程序与随机数字表的基本程序一样,直到取足样 本为止。 (2)系统随机抽样 系统随机抽样又称等距抽样或机械抽样,是把总体中的所有个体按某一顺序排列编号,然 后依固定的间隔抽取样本。先随机确定第一个样本数后,根据样本与总体的比例,每间隔 n 个 数抽取一个。例如,要从 800 名学生中抽取 100 人作为被试,先将被试按序编号,再按公式计 算抽样间隔的数字:800÷100 = 8,再从 1-8 中随机选定一个数字,假定为 6,那么编号 6,14, 22,,30,38,46……798 这 100 个号码的被试构成了系统随机抽样的样本。 系统随机抽样使样本分配均衡,更具代表性,抽样误差较简单随机抽样小,操作也较简单, 实际应用较广。系统随机抽样见下图: 可获得总体 样本 样本举例 1 2 3 4 5 6 7 8 9 10 随机开始后 11 12 13 14 15 16 17 18 19 20 每 5 个抽 1 3,8,13,18, 21 22 23 24 25 26 27 28 29 30 23,28,33,38, 31 32 33 34 35 36 37 38 39 40 43,48 41 42 43 44 45 46 47 48 49 50 图 7-4 系统随机抽样示意图 (3)分层随机抽样 分层随机抽样又称分类抽样或配额抽样,是将总体按某一标准分成若干层次或类别(子总 体),然后以各层或各类在总体中所占比重,按比例随机抽取样本。例如对某校 800 个学生进行 学习态度的调查,拟抽取十分之二的学生(160 人)作为样本。首先按成绩评定标准将学生分 成优、良、中、差四层,优(160 人),良(320 人),中(240 人),差(80 人)。然后用简单随 机抽样在这四层中按比例分别抽取样本,从优等中抽取 160ⅹ2/10=32 人;从良等中抽取 320ⅹ 2/10=64 人;从中等中抽取 240ⅹ2/10=48 人;从差等中抽取 80ⅹ2/10=16 人。这 160 人组成了 分层随机抽样的样本。 分层随机抽样确保每层子总体都被包容在抽样范围内,避免了某一子总体出现“超载”现 象或出现意外样本。对于总体构成比较复杂,同质性程度不高,总体数量较大,各层次标志比 较明显的情况下,宜采用分层随机抽样。分层随机抽样见下图:
可获得总体 样本 样本举例 2345678910随机抽取4个 l1121314151617181920 3132 1424344454647484950随机抽取6个 图7-5分层随机抽样示意图 (4)整群随机抽样 整群随机抽样就是以自然群体(学校、班级等)为单位,从较大的群总体中随机抽取样本 整群随机抽样与其他抽样方式的区别在于:它抽取样本的单位是群体,不是个体。例如要在某 区初一年级进行一项研究,我们可以随机抽取几所学校,在这几所学校初一年级中再随机抽取 两个班级作为样本,班中的所有个体都为被试 采用整群随机抽样比较方便,也切实可行。这种抽样不会因硏究而打乱原有的班级,能兼 顾到常规的教学秩序,不会影响师生之间的配合。整群随机抽样可以节省取样在人力、物力上 的费用,最适合于总体范围大,抽样数量多的研究。但是整群随机抽样所获得的样本分布可能 不均匀,群体间可能会存在差异,在一定程度上会影响样本的代表性。因此,当采用整群随机 抽样时,要考虑群体和群体之间是否同质。一般来说,按常态编班的班级,彼此间有较高的同 质性,按能力分班的班级,同质性较低 2、非概率抽样 非概率抽样是指每个研究对象被抽取的概率是未知的,抽样方式不是随机的,样本通常是 按研究目的而选择的。非概率抽样常用于定性研究或小范围的非正式的研究中。具体的抽样方 法有: (1)目的抽样 目的抽样是在硏究情境不能运用随机抽样时,为达到硏究目的,研究者根据自己的判断而 选择样本的抽样方法。目的抽样与随机抽样的区别在于它们抽样的方式不同,它们运用的逻辑 基础不同。随机抽样的逻辑基础是所选择的样本要有代表性,而目的抽样的逻辑基础是想掌握 和了解样本的实际情况。目的抽样并非是随意的,样本的选择是以实现确定的目的、准则为依 据的。例如,记者的采访一般都采用目的抽样,不是以随机的方式获取被试,而是有目标地选 择被试。虽然这样的研究结果不一定能推断到总体中去,但获取样本方便 (2)完全抽样 完全抽样就是样本数量和总体数量完全一致。这是抽样的特例,通常在总体数量极少的情 况下适用。例如,某校有8位因学业成绩特别差而留级的学生,研究者就将这8位学生全部作 为样本进行研究 (3)异质抽样 异质抽样就是抽取某些特征完全不同的、差异最大的个体为样本,目的是为了获得两类信 息:一是不同个体之间的区别和差异;二是不同个体之间的共同之处。例如,要描述学校工作 现状,研究者可选择学生特征、教师管理方式、所处社区环境以及其他统计特征都不相同的学 校作样本,也可选择反差最大的,处于问题两头的极端个案作为样本。采用异质抽样的研究常 常是比较研究。 (4)同质抽样 同质抽样就是选择具有典型意义的、特征相近的个体为样本。与异质抽样相比,同质抽样 走的是中间道路。例如,在一项研究中,既不选最好的学校,也不选最差的学校,而是选择中 等程度的学校。这些学校的特征具有典型性和相似性,能代表大多数的普通学校
可获得总体 样本 样本举例 1 2 3 4 5 6 7 8 9 10 随机抽取 4 个 11 12 13 14 15 16 17 18 19 20 1,7,12,13, 21 22 23 24 25 26 27 28 29 30 21,22,23,30, 31 32 33 34 35 36 37 38 39 40 32,35 41 42 43 44 45 46 47 48 49 50 随机抽取 6 个 图 7-5 分层随机抽样示意图 (4)整群随机抽样 整群随机抽样就是以自然群体(学校、班级等)为单位,从较大的群总体中随机抽取样本, 整群随机抽样与其他抽样方式的区别在于:它抽取样本的单位是群体,不是个体。例如要在某 区初一年级进行一项研究,我们可以随机抽取几所学校,在这几所学校初一年级中再随机抽取 两个班级作为样本,班中的所有个体都为被试。 采用整群随机抽样比较方便,也切实可行。这种抽样不会因研究而打乱原有的班级,能兼 顾到常规的教学秩序,不会影响师生之间的配合。整群随机抽样可以节省取样在人力、物力上 的费用,最适合于总体范围大,抽样数量多的研究。但是整群随机抽样所获得的样本分布可能 不均匀,群体间可能会存在差异,在一定程度上会影响样本的代表性。因此,当采用整群随机 抽样时,要考虑群体和群体之间是否同质。一般来说,按常态编班的班级,彼此间有较高的同 质性,按能力分班的班级,同质性较低。 2、非概率抽样 非概率抽样是指每个研究对象被抽取的概率是未知的,抽样方式不是随机的,样本通常是 按研究目的而选择的。非概率抽样常用于定性研究或小范围的非正式的研究中。具体的抽样方 法有: (1)目的抽样 目的抽样是在研究情境不能运用随机抽样时,为达到研究目的,研究者根据自己的判断而 选择样本的抽样方法。目的抽样与随机抽样的区别在于它们抽样的方式不同,它们运用的逻辑 基础不同。随机抽样的逻辑基础是所选择的样本要有代表性,而目的抽样的逻辑基础是想掌握 和了解样本的实际情况。目的抽样并非是随意的,样本的选择是以实现确定的目的、准则为依 据的。例如,记者的采访一般都采用目的抽样,不是以随机的方式获取被试,而是有目标地选 择被试。虽然这样的研究结果不一定能推断到总体中去,但获取样本方便。 (2)完全抽样 完全抽样就是样本数量和总体数量完全一致。这是抽样的特例,通常在总体数量极少的情 况下适用。例如,某校有 8 位因学业成绩特别差而留级的学生,研究者就将这 8 位学生全部作 为样本进行研究。 (3)异质抽样 异质抽样就是抽取某些特征完全不同的、差异最大的个体为样本,目的是为了获得两类信 息:一是不同个体之间的区别和差异;二是不同个体之间的共同之处。例如,要描述学校工作 现状,研究者可选择学生特征、教师管理方式、所处社区环境以及其他统计特征都不相同的学 校作样本,也可选择反差最大的,处于问题两头的极端个案作为样本。采用异质抽样的研究常 常是比较研究。 (4)同质抽样 同质抽样就是选择具有典型意义的、特征相近的个体为样本。与异质抽样相比,同质抽样 走的是中间道路。例如,在一项研究中,既不选最好的学校,也不选最差的学校,而是选择中 等程度的学校。这些学校的特征具有典型性和相似性,能代表大多数的普通学校
(5)立意抽样 立意抽样又称定标抽样,是研究者根据自己确定的标准,凭自己的经验和主观判断来决定 所需样本。立意抽样注重样本质的方面,能针对性地研究某些问题,经济实用,但抽样的主观 性较强。例如,对教师成长过程进行研究,选择那些得过奖的优秀教师为样本。对儿童学习能 力进行研究,选择那些超常儿童作为被试等。 (6)方便抽样 方便抽样又称随意抽样,指按硏究者的需要和方便,利用现有的机会对偶然遇到的对象进 行抽样。例如,研究者与某一学校的校长熟识,征得同意后,以该校学生作为样本。又如,抽 取某次演讲的听众或正在图书阅览室看书的学生为被试进行调查。方便抽样简便易行,是为大 家经常采用的方法,但它受研究者主观意志的支配,很难保证样本的代表性,对数据作出推论 时必须非常小心。 (7)关键案例抽样 关键案例抽样就是选择一个可以对一个理论及其现象提供严格测试的样本。巴顿( Michae Patton)曾对关键案例抽样提供了一个很好的例子。 在伽利略的重力的硏究中,他想要探知物体的重量是否影响它降落的速度。为了能 推广到世界上所有物体,他并没有随机抽取不同重量的物体,而是选择了一个关键 案例——羽毛。正如他演示的那样,如果在真空管中,羽毛与其他更重的物体(如 硬币)以相同的速度下降,那么他就能从这一个关键案例研究的结果以符合逻辑的 方式推广到切物体。他的发现十分有用而且可信。 教育研究中,很难会有像自然科学发现那样的精确结果,但是关键案例抽样的方法则有助 于人们去探索决定性的案例,更进一步理解教育现象。假如决定性的案例成立,那么就有理由 在更大范围推广这一研究结果。 (8)滚雪球抽样 滚雪球抽样就是根据已有研究对象的建议或线索找岀其他硏宄对象的累积过程。是先抽取 目标群体少数成员,然后向他们询问有关信息,再获得更多的研究对象。如了解学校社团组织 招募人员的方式,可以先访问新近人员,向他们询问是谁介绍进这个组织的。然后再访问被提 到那些人,询问他们是谁介绍加入组织的。样本像“雪球”一样越滚越大。这种方法常用在定 性的实地调査研究中,或探索性研究中。 选择研究对象是研究者必须面对的实际问题。具体抽样的方法,样本容量的大小,应根据 研究的实际情况而定。一般来说,概率抽样不受抽样者主观意志的影响,能确切地定义样本, 确定抽样概率,抽样误差比较小,并能从样本推断总体,为硏究结果的准确性和可靠性提供保 证。然而,概率抽样并非在任何情况下都是可行的,不同的研究目的要求不同的抽样方法与其 相适应。非概率抽样比较灵活,操作简单方便,不受统计原理框架的限制,但抽样的主观性较 强,缺乏代表性。当运用非概率抽样时,代表性就不可能在概率的基础上进行讨论,只能在逻 辑的基础上进行讨论。因此,在条件许可的情况下,应尽可能采用概率抽样 五、避免抽样偏差 抽样的目的就是要以具体的样本资料来解释总体的基本状态,因此要求样本资料能充分反 映总体的真实情况,只有这样对研究结果的解释才确切可信。然而样本数据和总体实际之间会 有差异存在,这种差异可以来源于两种原因:抽样误差( sampling error)和抽样偏差( sampling bias)。了解抽样误差的影响因素,把握抽样误差的来源,可以减少或避免误差的产生,提髙硏 究的质量。 (美)高尔等著:许庆豫等译:《教育研究方法导论》,江苏教育出版社,2002年,第198页
(5)立意抽样 立意抽样又称定标抽样,是研究者根据自己确定的标准,凭自己的经验和主观判断来决定 所需样本。立意抽样注重样本质的方面,能针对性地研究某些问题,经济实用,但抽样的主观 性较强。例如,对教师成长过程进行研究,选择那些得过奖的优秀教师为样本。对儿童学习能 力进行研究,选择那些超常儿童作为被试等。 (6)方便抽样 方便抽样又称随意抽样,指按研究者的需要和方便,利用现有的机会对偶然遇到的对象进 行抽样。例如,研究者与某一学校的校长熟识,征得同意后,以该校学生作为样本。又如,抽 取某次演讲的听众或正在图书阅览室看书的学生为被试进行调查。方便抽样简便易行,是为大 家经常采用的方法,但它受研究者主观意志的支配,很难保证样本的代表性,对数据作出推论 时必须非常小心。 (7)关键案例抽样 关键案例抽样就是选择一个可以对一个理论及其现象提供严格测试的样本。巴顿(Michael Patton)曾对关键案例抽样提供了一个很好的例子①。 在伽利略的重力的研究中,他想要探知物体的重量是否影响它降落的速度。为了能 推广到世界上所有物体,他并没有随机抽取不同重量的物体,而是选择了一个关键 案例——羽毛。正如他演示的那样,如果在真空管中,羽毛与其他更重的物体(如 硬币)以相同的速度下降,那么他就能从这一个关键案例研究的结果以符合逻辑的 方式推广到一切物体。他的发现十分有用而且可信。 教育研究中,很难会有像自然科学发现那样的精确结果,但是关键案例抽样的方法则有助 于人们去探索决定性的案例,更进一步理解教育现象。假如决定性的案例成立,那么就有理由 在更大范围推广这一研究结果。 (8)滚雪球抽样 滚雪球抽样就是根据已有研究对象的建议或线索找出其他研究对象的累积过程。是先抽取 目标群体少数成员,然后向他们询问有关信息,再获得更多的研究对象。如了解学校社团组织 招募人员的方式,可以先访问新近人员,向他们询问是谁介绍进这个组织的。然后再访问被提 到那些人,询问他们是谁介绍加入组织的。样本像“雪球”一样越滚越大。这种方法常用在定 性的实地调查研究中,或探索性研究中。 选择研究对象是研究者必须面对的实际问题。具体抽样的方法,样本容量的大小,应根据 研究的实际情况而定。一般来说,概率抽样不受抽样者主观意志的影响,能确切地定义样本, 确定抽样概率,抽样误差比较小,并能从样本推断总体,为研究结果的准确性和可靠性提供保 证。然而,概率抽样并非在任何情况下都是可行的,不同的研究目的要求不同的抽样方法与其 相适应。非概率抽样比较灵活,操作简单方便,不受统计原理框架的限制,但抽样的主观性较 强,缺乏代表性。当运用非概率抽样时,代表性就不可能在概率的基础上进行讨论,只能在逻 辑的基础上进行讨论。因此,在条件许可的情况下,应尽可能采用概率抽样。 五、避免抽样偏差 抽样的目的就是要以具体的样本资料来解释总体的基本状态,因此要求样本资料能充分反 映总体的真实情况,只有这样对研究结果的解释才确切可信。然而样本数据和总体实际之间会 有差异存在,这种差异可以来源于两种原因:抽样误差(sampling error)和抽样偏差(sampling bias)。了解抽样误差的影响因素,把握抽样误差的来源,可以减少或避免误差的产生,提高研 究的质量。 ① (美)高尔等著;许庆豫等译:《教育研究方法导论》,江苏教育出版社,2002 年,第 198 页