闻非概率抽样聊 第六讲 简单易行并且经济的获得晶的方法,不完 非概率抽样方法 使用非率样的最大问n 用非都率抽样从总体中抽选单位可能会导激较大的偏整 b在社调中非经常使用市研人员经扣非 率抽样作为种省快的方法来代新率抽。 例如,在非新率抽样中访问员经常主观决定谁应该入样 無非率抽样中,由有选择偏差以及缺乏抽样棍,我们 晚·由于访问员总是愿意选择总体中那些最容 不可能计算出各个单位的入样概率,从而无法得到可鑫 好的单位,使总体中很大一部分单位完全 的估计值,也无法计算抽样误。我们已经知道,样本 机金,而这些单位与被抽中的单位间很可 要能对总体进行推新,必须假定样本对总体有代表性 不同 从某个型,或者是均匀 这不仅将使调查结果出现 由于带有选择平均 地或者是雕机地分布的 非概率抽样来讲,由于抽 单位和排除极端值的倾向,将错误地减少总体中明显的 选单位的方法有偏差,做这种假定的风险是很大的。 变异性 这是因为非都率抽样能用在下面几个方面的研究中 非帮率抽常被用于轴选参加点產谈和派度访问的人 一用来形法 一作为初始步,以帮励设新排的方案 为非率抽能发择较好作用的例子是制始新究。如果正在设计 伪为后少。帮动抽站果 项新的洞查,对调查的城又所知基少,则试点训度常果用非薇 比如,非新率抽样能在调查的期就提供非常有价值的值息。它也 以了解人们的态度、做仰、动机和 行为分拆新排的具。有时,非样是一可 的办法例如,在医学实验中,果用自属者抽样可能是取得救的唯
1 Journalism & Communication School 新闻传播学院 非概率抽样方法 主讲教师:沈浩 北京广播学院新闻传播学院 副教授 北京广播学院研究统计研究所 副所长 第六讲 新闻传播学院 2 非概率抽样 Non-probability Sampling 非概率抽样 • 是一种快速、简单易行并且经济的获得数据的方法,不需要完 整的抽样框。 使用非概率抽样的最大问题: • 由于用非概率抽样从总体中抽选单位可能会导致较大的偏差, 我们不清楚能否对总体进行推断。 在社会调查中,非概率抽样经常使用,市场研究人员经常把非 概率抽样作为一种省钱快速的方法来代替概率抽样。 新闻传播学院 3 例如,在非概率抽样中访问员经常主观决定谁应该入样。 • 由于访问员总是愿意选择总体中那些最容易接近和最友 好的单位,使总体中很大一部分单位完全没有被抽中的 机会,而这些单位与被抽中的单位间很可能有系统性的 不同。 • 这不仅将使调查结果出现偏差,而且由于带有选择平均 单位和排除极端值的倾向,将错误地减少总体中明显的 变异性。 新闻传播学院 4 非概率抽样中,由于有选择偏差以及缺乏抽样框,我们 不可能计算出各个单位的入样概率,从而无法得到可靠 的估计值,也无法计算抽样误差。我们已经知道,样本 要能对总体进行推断,必须假定样本对总体有代表性。 而这通常需要假定总体指标服从某个模型,或者是均匀 地或者是随机地分布的。对于非概率抽样来讲,由于抽 选单位的方法有偏差,做这种假定的风险是很大的。 新闻传播学院 5 这是因为非概率抽样能用在下面几个方面的研究中: • ------用来形成一种想法; • ------作为初始步骤,以帮助设计概率抽样调查的方案; • ------作为后续步骤,帮助理解概率抽样调查结果; 比如,非概率抽样能在调查的早期就提供非常有价值的信息。它也 可用在探索性或诊断性研究中,以了解人们的态度、信仰、动机和 行为,或分析概率抽样调查的结果。有时,非概率抽样是唯一可行 的办法例如,在医学实验中,采用自愿者抽样可能是取得数据的唯 一途径。 新闻传播学院 6 非概率抽样常被用于抽选参加焦点座谈和深度访问的人。 非概率抽样能发挥较好作用的例子是初始研究。如果正在设计一 项新的调查,对调查的领域又所知甚少,则试点调查常采用非概 率抽样
随意抽样 二非拿抽样有五神不同方式 单位的抽选是以无目标、的小行几没有取亮金没 有训划 单叔定总你是网质的:如果总你中的单位部是 演球抽料 相似的,那么可以抽造任何单位构成料本。 自愿者抽样 判新抽样 的,“头兰料将亚访问员的偏好和谁在样的时美巧 ·修正的概率抽样。 自愿者抽样 期判断抽样 使用这时,被调者部是真者。一亲说,皮自人员透行 那用判料方法时,抽是以过金对总体构成与行为的了解为芯 间选,以舞圆食查目的的指标属者方法有教大的抛选 由对总体有很好了的决定总体中盖单位皮入得。换句话说, 偏能,但有时录用这种方局要的。例,出道上的考意,数们 由喻家有目的地选他认为有代性的本。列受新人员 的另一个侧子是打电话与广电视节目的人,论某个同时 象反到了中,如果強象不者的話,着金产生教大的 盖。不过这种法在诉如城加点小姐订论酸录访 心有这那点的人才金响应。大人不响应,这身 例如验问兽的菜个传定方附是很有用的。但是判摘 录度访问的人 篇配额抽样 食边雖立的制制。数立的况抽料是根调总体的不网帕性,对属 無有某个性的查样本分氯定单分限氯 取网以上性的料本.國此,员就有比大的商由去悬总 配并量有氯定,所以本上是获舞转宠子总体的目标样 体中的料本。 果用事对越帅中所有单位旋属性、征分为干美 ,这性、为的。如被着篚名、年收 入业、文化度等熊后魏服个任分料就 450元上 为配方法筒单暴行,可以保证总体的备个美别部能包在抽本 之中与其他几帆抽方滋棚比,具有较高的代泉性
2 新闻传播学院 7 非概率抽样有五种不同方式: • 随意抽样 • 滚雪球抽样 • 自愿者抽样 • 判断抽样 • 配额抽样 • 修正的概率抽样。 新闻传播学院 8 单位的抽选是以无目标、随意的方式进行,几乎没有或完全没 有计划。随意抽样假定总体是同质的:如果总体中的单位都是 相似的,那么可以抽选任何单位构成样本。 随意抽样的一个例子是“街头拦截”访问法,访问员抽选任何一 个碰巧路过的人进行调查。不幸的是,除非总体真正是同质 的,“街头拦截”抽样将受访问员的偏好和谁在抽样的时候碰巧 路过的影响。 随意抽样 新闻传播学院 9 使用这种方法时,被调查者都是自愿者。一般来说,应对自愿人员进行 筛选,以得到一组符合调查目的的指标。自愿者抽样方法有较大的抽选 偏差,但有时采用这种方法是必要的。例如,出于道德上的考虑,我们 可能不得不请求具有特定病情的人自愿参加某些医疗实验。自愿者抽样 的另一个例子是打电话参与广播或电视节目的人,讨论某一个问题时, 我们邀请听众打电话发表他们的意见。只有那些对所讨论的主题十分关 心,有这样或那样观点的人,才会响应。大多数人不会响应,这样就会 导致较大的选择性偏差。自愿者抽样有时用来抽选参加焦点小组讨论或 深度访问的人。 自愿者抽样 新闻传播学院 10 采用判断抽样方法时,抽样是以过去对总体构成与行为的了解为基础, 由对总体有很好了解的专家决定总体中哪些单位应该入样。换句话说, 由专家有目的地抽选他认为“有代表性”的样本。判断抽样要受研究人员 倾向性的影响,可能比随意抽样的偏差还要大。由于研究人员的主观想 象反映到了样本中,如果这种主观想象不准确的话,就会产生较大的偏 差。不过,这种方法在探索性研究,如抽选参加焦点小组讨论或深度访 谈的人(例如检验问卷的某个特定方面)时是很有用的。但是,判断抽 样不宜用在试点调查中。 判断抽样 新闻传播学院 11 配额抽样是最常见的一种非概率抽样。抽样是要从各个子总体中选取特 定数量的单位,即对各个子总体分配一定的名额,对如何抽取相应子总 体的配额并没有规定,所以配额抽样本质上是获得特定子总体的目标样 本量。 配额抽样 采用配额抽样,事先要对总体中所有单位按其属性、特征分为若干类 型,这些属性、特征称为“控制特征”。如被调查者的姓名、年龄、收 入、职业、文化程度等,然后,按照各个控制特征分配样本数额。 配额抽样方法简单易行,可以保证总体的各个类别都能包括在所抽样本 之中,故与其他几种非随机抽样方法相比,样本具有较高的代表性。 新闻传播学院 12 独立控制配额抽样。独立控制配额抽样是根据调查总体的不同特性,对具 有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两 种或两种以上特性的样本数额。因此,调查员就有比较大的自由去选择总 体中的样本。 合计 200 20 50 70 60 150元以下 150-300元 300-450元 450元以上 月收入 人数 合计 200 40 60 70 30 30岁以下 30-40元 40-50元 50元以上 月收入 人数 合计 200 100 100 男 女 月收入 人数
E叉控制配额抽样 非概率抽样的优点: 15@先以下15030先 外面去,向在衡上 到的普一百个人提同几, v对忄,个,量只几个小时而且 率利本的分不广园,访同员的收 为不饪 女叉则氧一个转性所■分的本激都做了具休制定 为非率对性和调的设开发有用 制,从面寞服了立的点,提高了本的 非概 的缺点: 「分析工具和软件 CTPLLJITHIS 为了对总体行,备对本的代来性做俱的假定,由于新有 uMT 抽料有逸性鼎盖,觉养的定常有假大的风 幼由于不可能得总体单位入样本的率故不可计算出可靠 m772 的计值以及漫_情计 训矿帆及缙是氧款、能就芹的发展 武们敷舞和分成为阜的事
3 新闻传播学院 13 是对调查对象的各个特性的样本数额交叉分配。 合计 20 8 30 20 37 33 13 39 200 40 60 70 30 6 1 30 2 6 1 3 3 7 16 7 3 7 10 12 8 5 6 4 5 5 20 3 2 2 3 1 2 2 3 10 15 30岁以下 30-40岁 40-50岁 50岁以上 合 男 女 男 女 男 女 男 女 计 150元以下 150-300元 300-450元 450元以上 交叉控制配额抽样对每一个控制特性所需分配的样本数都做了具体规定, 调查员必须按规定在总体中抽取调查单位,由于各个特性都同时得到了控 制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。 交叉控制配额抽样 新闻传播学院 14 快速简便。 一般而言,非概率样本能被很快抽出和调查:到外面去,向在街上遇 到的前一百个人提问题,很容易。 费用相对较低。 对一个访问员来说,进行这样一个调查,通常只需要几个小时。而且 非概率样本的地理分布一般不广,因此,访问员的旅费较低。 不需要任何抽样框。 非概率抽样对探索性研究和调查的设计开发很有用。 非概率抽样的优点: 新闻传播学院 15 为了对总体进行推断,需要对样本的代表性做很强的假定。由于所有 非概率抽样都有选择性偏差,做这样的假定通常有很大的风险。 由于不可能得到总体单位被抽选入样本的概率,故不可能计算出可靠 的估计值以及抽样误差估计值。 非概率抽样的缺点: 新闻传播学院 16 计算机及数据处理软件、统计软件的发展 使得我们做数据和统计分析成为简单而可能的事情。 分析工具和软件 • WORD • EXECL • PowerPoint PowerPoint • Access • Microsoft Visio Microsoft Visio • SmartDraw • PCEDIT • EpiData EpiData • SPSS Enter Station & Builder SPSS Enter Station & Builder • SPSS for Windows 8.0 SPSS for Windows 8.0-11.5 • AnswerTree AnswerTree3.0 • Decision Time and What If Decision Time and What If • Clementine 7.0 Clementine 7.0-7.2 • SAS 6.12 SAS 6.12-8.2 • Lisrel8.53 &Amos5.0 Amos5.0 • Network Analysis Network Analysis 新闻传播学院 17 新闻传播学院 18
EEHEE TE METHOD 98482 1000 HETHOD Cres ben oo"csB+自o .51.0=500
4 新闻传播学院 19 Dimension 1 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 Dimension 2 2.0 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 METHOD AGE SEX JUMP GUN DROWN HANG GAS POISON 70-90 55-65 40-50 25-35 10-20 Famels Males 新闻传播学院 20 Row and Column Points Dimension 1 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 Dimension 2 1.0 .5 0.0 -.5 -1.0 -1.5 METHOD SEXAGE JUMP GUN DROWN HANG GAS POISON F80 F60 F45 F30 F15 M80 M60 M45 M30 M15 新闻传播学院 21 SEX 30977 63.3 63.3 63.3 17984 36.7 36.7 100.0 48961 100.0 100.0 1 Males 2 Famels Total Valid Frequency Percent Valid Percent Cumulative Percent 新闻传播学院 22 METHOD 17565 35.9 35.9 35.9 2407 4.9 4.9 40.8 20377 41.6 41.6 82.4 2649 5.4 5.4 87.8 3118 6.4 6.4 94.2 2845 5.8 5.8 100.0 48961 100.0 100.0 1 POISON 2 GAS 3 HANG 4 DROWN 5 GUN 6 JUMP Total Valid Frequency Percent Valid Percent Cumulative Percent 新闻传播学院 23 Dimension 1 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 Dimension 2 2.0 1.5 1.0 .5 0.0 -.5 -1.0 -1.5 METHOD AGE SEX JUMP GUN DROWN HANG GAS POISON 70-90 55-65 40-50 25-35 10-20 Famels Males 新闻传播学院 24 SEXAGE * METHOD Crosstabulation Count 1160 335 1524 67 512 189 3787 2823 883 2751 213 852 366 7888 2465 625 3936 247 875 244 8392 1531 201 3581 207 477 273 6270 938 45 2948 212 229 268 4640 921 40 212 30 25 131 1359 1672 113 575 139 64 276 2839 2224 91 1481 354 52 327 4529 2283 45 2014 679 29 388 5438 1548 29 1355 501 3 383 3819 17565 2407 20377 2649 3118 2845 48961 11 M15 12 M30 13 M45 14 M60 15 M80 21 F15 22 F30 23 F45 24 F60 25 F80 SEXAGE Total 1 POISON 2 GAS 3 HANG 4 DROWN 5 GUN 6 JUMP METHOD Total
5 50 1.5 5
5 新闻传播学院 25 Dimension 1 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 Dimension 2 1.0 .5 0.0 -.5 -1.0 -1.5 JUMP GUN DROWN HANG GAS POISON F60 F80 F45 F30 F15 M80 M60 M45 M30 M15