正在加载图片...
更远的例子可以追溯到著名的《文学文摘》( Literary Digest)的惨败, 这件事发生在1936年。曾经准确预测了1932年美国大选的1000万个电话用户 和《文学文摘》订户,他们又对1936年的大选结果进行了预测,他们向那个倒 霉的杂志编辑信誓旦旦地保证:兰登( Landon)将在竞选中脱颖而出,并且与罗 斯福( Roosevelt)的所得票数之比为370:161。这样一个久经考验的调查群体 怎么可能产生误差呢?但的确有误差,正如后来许多大学论文和其他史学分析人 员所发现的,1936年就有能力购买电话和订阅杂志的人并不能代表所有的选民, 至少在经济上,他们是一个极特殊的群体,是有偏的,后来证实他们中的许多人 是共和党的选民。该样本选择了兰登,而全国选民却心系罗斯福 三、随机样本的代表性 最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本 总体即形成样本的母体。把索引卡片文件夹中每隔10个的名字抽出来,从许多 纸张中任意抽出50张,在皮卡迪利大街译者注:皮卡迪利大街是英国伦敦市 条繁华的街道。每遇见的第20个人作为访问对象。(但需要注意的是,在最后 个例子中,总体并不是全世界的人,也不是全体英国人或者所有旧金山人,而 只是当时在皮卡迪利大街上的人。一个进行民意调查的访问员宣称,她选择在火 车站进行调查的原因是“在那里能遇到所有类型的人。”不过,不得不向她指出 的是,某些人比如婴儿母亲的代表性并不足。) 随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率 被选进样本?纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有 不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯 考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和 市场研究等领域中得到了广泛的应用。 为了获得分层抽样下的随机样本,你需要将总体按照事先已知的优势比例划 分出不同的组。这时你就可能遇上麻烦:关于分组比例的信息可能并不正确。你 对访问员进行指导,以确保他们调查到一定数量的黑人,按照这样或那样的比例 调查属于不同收入阶层的人,调查一定数量的农民,等等。同时,每一组人中 40岁以下和40岁以上的人数相同。6 更远的例子可以追溯到著名的《文学文摘》(Literary Digest)的惨败, 这件事发生在 1936 年。曾经准确预测了 1932 年美国大选的 1000 万个电话用户 和《文学文摘》订户,他们又对 1936 年的大选结果进行了预测,他们向那个倒 霉的杂志编辑信誓旦旦地保证:兰登(Landon)将在竞选中脱颖而出,并且与罗 斯福(Roosevelt)的所得票数之比为 370∶161。这样一个久经考验的调查群体 怎么可能产生误差呢?但的确有误差,正如后来许多大学论文和其他史学分析人 员所发现的,1936 年就有能力购买电话和订阅杂志的人并不能代表所有的选民, 至少在经济上,他们是一个极特殊的群体,是有偏的,后来证实他们中的许多人 是共和党的选民。该样本选择了兰登,而全国选民却心系罗斯福。 三、随机样本的代表性 最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。 总体即形成样本的母体。把索引卡片文件夹中每隔 10 个的名字抽出来,从许多 纸张中任意抽出 50 张,在皮卡迪利大街译者注:皮卡迪利大街是英国伦敦市一 条繁华的街道。每遇见的第 20 个人作为访问对象。(但需要注意的是,在最后 一个例子中,总体并不是全世界的人,也不是全体英国人或者所有旧金山人,而 只是当时在皮卡迪利大街上的人。一个进行民意调查的访问员宣称,她选择在火 车站进行调查的原因是“在那里能遇到所有类型的人。”不过,不得不向她指出 的是,某些人比如婴儿母亲的代表性并不足。) 随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率 被选进样本?纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有 不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯 考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和 市场研究等领域中得到了广泛的应用。 为了获得分层抽样下的随机样本,你需要将总体按照事先已知的优势比例划 分出不同的组。这时你就可能遇上麻烦:关于分组比例的信息可能并不正确。你 对访问员进行指导,以确保他们调查到一定数量的黑人,按照这样或那样的比例 调查属于不同收入阶层的人,调查一定数量的农民,等等。同时,每一组人中 40 岁以下和 40 岁以上的人数相同
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有