正在加载图片...
四、缺失数据的处理 实际中,可能还会遇到项目无回答(即缺失数据)的问题,从而影响调 查结果的系统性和完整性,给进二步的统计分析带来一系列麻烦,因 茈,有必要对缺失薮据的处理问题作一些讨论。 缺失数据的弥补主要是采用插值法,一般分成“冷卡”(Cold-deck) 法和“热卡”(Hot-deck)法。 “冷卡”方法是用来自其他调査或过去调查的资料作为当前调查中缺 用的,因为在这种情 “热卡”方法是对调査中发现的项目缺失值,用按一定准则选出的 一调查中与无回答单元具有相似性的回单元的数值进行替代。 然 ,这可能会引出两个问题 是一些回答单元的数据没有机会成为 替代值;二是一些回答单元的数据会被多次使用。因此,作为改进, 方面可以将回答单元融合在一起构成一个完整的回答单元集,并 其作为替代单元集,当出现无回答时,在替代单元集中随机抽选回答 单元数据进行替代(或称插补),另一方面,可以允许多重替代,但要 对每个回答单元数据用于替代的次数加以控制。便用“热卡”方法的 种更为简便的情形是,以回答单元数据的平均值代替缺失值。“热 卡”方法实质上只是使资料看起来是完整的,这样便于运用统计方法 进行运算处理和分析研究,但这种替代的数据对统计分析的结果并不 生影响。• 四、缺失数据的处理 • 实际中,可能还会遇到项目无回答(即缺失数据)的问题,从而影响调 查结果的系统性和完整性,给进一步的统计分析带来一系列麻烦,因 此,有必要对缺失数据的处理问题作一些讨论。 • 缺失数据的弥补主要是采用插值法,一般分成“冷卡”(Cold—deck) 法和“热卡”(Hot—deck)法。 • “冷卡”方法是用来自其他调查或过去调查的资料作为当前调查中缺 失数据的替代。这种方法在周期性调查中是很有用的,因为在这种情 况下,可以用前一期的调查数据替代目前调查的缺失值。 • “热卡”方法是对调查中发现的项目缺失值,用按一定准则选出的、 同一调查中与无回答单元具有相似性的回答单元的数值进行替代。当 然,这可能会引出两个问题:一是一些回答单元的数据没有机会成为 替代值;二是一些回答单元的数据会被多次使用。因此,作为改进, 一方面可以将回答单元融合在一起构成一个完整的回答单元集,并以 其作为替代单元集,当出现无回答时,在替代单元集中随机抽选回答 单元数据进行替代(或称插补),另一方面,可以允许多重替代,但要 对每个回答单元数据用于替代的次数加以控制。使用“热卡”方法的 一种更为简便的情形是,以回答单元数据的平均值代替缺失值。“热 卡”方法实质上只是使资料看起来是完整的,这样便于运用统计方法 进行运算处理和分析研究,但这种替代的数据对统计分析的结果并不 产生影响
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有