6 更远的例子可以追溯到著名的《文学文摘》（Literary Digest

点击下载：延安大学：《社会统计学 Social Statistics》课程教学资源（教学案例）案例一：内在有偏的样本

正在加载图片...

更远的例子可以追溯到著名的《文学文摘》( Literary Digest)的惨败, 这件事发生在1936年。曾经准确预测了1932年美国大选的1000万个电话用户和《文学文摘》订户,他们又对1936年的大选结果进行了预测,他们向那个倒霉的杂志编辑信誓旦旦地保证:兰登( Landon)将在竞选中脱颖而出,并且与罗斯福( Roosevelt)的所得票数之比为370:161。这样一个久经考验的调查群体怎么可能产生误差呢?但的确有误差,正如后来许多大学论文和其他史学分析人员所发现的,1936年就有能力购买电话和订阅杂志的人并不能代表所有的选民, 至少在经济上,他们是一个极特殊的群体,是有偏的,后来证实他们中的许多人是共和党的选民。该样本选择了兰登,而全国选民却心系罗斯福三、随机样本的代表性最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本总体即形成样本的母体。把索引卡片文件夹中每隔10个的名字抽出来,从许多纸张中任意抽出50张,在皮卡迪利大街译者注:皮卡迪利大街是英国伦敦市条繁华的街道。每遇见的第20个人作为访问对象。(但需要注意的是,在最后个例子中,总体并不是全世界的人,也不是全体英国人或者所有旧金山人,而只是当时在皮卡迪利大街上的人。一个进行民意调查的访问员宣称,她选择在火车站进行调查的原因是“在那里能遇到所有类型的人。”不过,不得不向她指出的是,某些人比如婴儿母亲的代表性并不足。) 随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本?纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。为了获得分层抽样下的随机样本,你需要将总体按照事先已知的优势比例划分出不同的组。这时你就可能遇上麻烦:关于分组比例的信息可能并不正确。你对访问员进行指导,以确保他们调查到一定数量的黑人,按照这样或那样的比例调查属于不同收入阶层的人,调查一定数量的农民,等等。同时,每一组人中 40岁以下和40岁以上的人数相同。6 更远的例子可以追溯到著名的《文学文摘》（Literary Digest）的惨败，这件事发生在 1936 年。曾经准确预测了 1932 年美国大选的 1000 万个电话用户和《文学文摘》订户，他们又对 1936 年的大选结果进行了预测，他们向那个倒霉的杂志编辑信誓旦旦地保证：兰登（Landon）将在竞选中脱颖而出，并且与罗斯福（Roosevelt）的所得票数之比为 370∶161。这样一个久经考验的调查群体怎么可能产生误差呢？但的确有误差，正如后来许多大学论文和其他史学分析人员所发现的，1936 年就有能力购买电话和订阅杂志的人并不能代表所有的选民，至少在经济上，他们是一个极特殊的群体，是有偏的，后来证实他们中的许多人是共和党的选民。该样本选择了兰登，而全国选民却心系罗斯福。三、随机样本的代表性最基本的样本是随机样本，它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。把索引卡片文件夹中每隔 10 个的名字抽出来，从许多纸张中任意抽出 50 张，在皮卡迪利大街译者注：皮卡迪利大街是英国伦敦市一条繁华的街道。每遇见的第 20 个人作为访问对象。（但需要注意的是，在最后一个例子中，总体并不是全世界的人，也不是全体英国人或者所有旧金山人，而只是当时在皮卡迪利大街上的人。一个进行民意调查的访问员宣称，她选择在火车站进行调查的原因是“在那里能遇到所有类型的人。”不过，不得不向她指出的是，某些人比如婴儿母亲的代表性并不足。）随机样本的检验方法是：总体中的每个名字或每个事物是否具有相同的几率被选进样本？纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处，在很多情况下，获得这种样本的难度很大并且十分昂贵，以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品，目前在民意调查和市场研究等领域中得到了广泛的应用。为了获得分层抽样下的随机样本，你需要将总体按照事先已知的优势比例划分出不同的组。这时你就可能遇上麻烦：关于分组比例的信息可能并不正确。你对访问员进行指导，以确保他们调查到一定数量的黑人，按照这样或那样的比例调查属于不同收入阶层的人，调查一定数量的农民，等等。同时，每一组人中 40 岁以下和 40 岁以上的人数相同

<<向上翻页向下翻页>>

点击下载：延安大学：《社会统计学 Social Statistics》课程教学资源（教学案例）案例一：内在有偏的样本