第十三章 测量手段的效度和信度 郝元涛 医学统计与流行病学系 2004.9
第十三章 测量手段的效度和信度 郝元涛 医学统计与流行病学系 2004.9
主要内容 1.信度、效度、反应度的概念; 2.测量手段的信度、效度评价 3.量表的信度、效度和反应度
主要内容: 1. 信度、效度、反应度的概念; 2. 测量手段的信度、效度评价; 3. 量表的信度、效度和反应度
引言 变异是统计数据的主要特征。 医学数据主要有两个变异来源 1.生物变异( biological variation):表现为 生物体之间的差异 2.测量误差 measurement error):主要表 现为在相同条件下对同一生物体进行重 复测定时测量结果与“真值”的差异 及几个重复测定值之间的差异
引言 ◼ 变异是统计数据的主要特征。 ◼ 医学数据主要有两个变异来源: 1. 生物变异(biological variation):表现为 生物体之间的差异; 2. 测量误差(measurement error):主要表 现为在相同条件下对同一生物体进行重 复测定时测量结果与 “真值” 的差异 及几个重复测定值之间的差异。*
硬数据和软数据 ■硬数据( hard data):基于化学、物 理和其它计量仪器得到的测量指标,如 身高1.73cm,体重62.3kg,由于测量结 果能够精确计量,称之为硬数据。 ■软数据( soft data):基于面谈、问 卷、量表等方法得到的测量指标,由于 测量结果不能够精确计量,称之为软数 据。例如:疼痛评分、生存质量评分 心理测量量表评分、对医院服务态度的 满意度等
硬数据和软数据 ◼硬数据(hard data):基于化学、物 理和其它计量仪器得到的测量指标,如 身高1.73cm,体重62.3kg,由于测量结 果能够精确计量,称之为硬数据。 ◼软数据(soft data):基于面谈、问 卷、量表等方法得到的测量指标,由于 测量结果不能够精确计量,称之为软数 据。例如:疼痛评分、生存质量评分、 心理测量量表评分、对医院服务态度的 满意度等
口不论是基于化学、物理仪器等关于 生理指标的测量,还是基于面谈 问卷、量表等关于心理指标的测量, 都需要有较好的测量手段,都需要 对测量手段的好坏心中有数。也就 是关于测量手段的效度和信度的问 题
◼ 不论是基于化学、物理仪器等关于 生理指标的测量,还是基于面谈、 问卷、量表等关于心理指标的测量, 都需要有较好的测量手段,都需要 对测量手段的好坏心中有数。也就 是关于测量手段的效度和信度的问 题
信度、效度、反应度的概念 1.效度σ validity):又称准确度,用以 反映测量结果与“真值”的接近程度。 影响数据效度的因素多为系统误差,如 测量者的感官偏差、测量仪器故障、评 价量表不能反映真实情况等
一、信度、效度、反应度的概念 1. 效度(validity):又称准确度, 用以 反映测量结果与“真值”的接近程度。 影响数据效度的因素多为系统误差, 如 测量者的感官偏差、测量仪器故障、评 价量表不能反映真实情况等
常用的评价效度的指标 ■内容效度( content validity):评价 测量指标的涵义是否能准确反映真实情 ■标准效度( criteria validity):以相 对准确的测量指标作为“金”标准考察 测量指标是否与其一致。 ■结构效度( construct validity):多 个测量结果是否具有稳定的结构
常用的评价效度的指标 ◼内容效度(content validity):评价 测量指标的涵义是否能准确反映真实情 况。 ◼标准效度(criteria validity):以相 对准确的测量指标作为“金”标准考察 测量指标是否与其一致。 ◼结构效度(construct validity):多 个测量结果是否具有稳定的结构
2.信度( reliability):又称可靠性或 精确度,用以反映相同条件下重复测定 结果的近似程度。信度主要受随机因素 的影响,偏倚不具有方向性 ■需注意的是,重复测定的可靠性,说明 的是重复测定结果彼此间的相似性,并 不涉及真值的大小,也不与真值相比 较
2. 信度(reliability):又称可靠性或 精确度, 用以反映相同条件下重复测定 结果的近似程度。信度主要受随机因素 的影响, 偏倚不具有方向性 。 ◼ 需注意的是, 重复测定的可靠性,说明 的是重复测定结果彼此间的相似性,并 不涉及真值的大小,也不与真值相比 较
导P导P 偏倚 真值 图131数据的效度、信度示意图
■有时,测量手段的信度是高的,但 却是无效的。 例如:在浴室里用同一个秤测量体重 测量的结果基本一致,说明信度较高。 但是因为测量的结果比实际重量轻5公斤 所以测量是无效的。 再例如:通过测量人们的脚的尺寸来评 价人的智商,测量的信度很高,却不可 能测量到人的智商
◼ 有时,测量手段的信度是高的,但 却是无效的。 ◼ 例如:在浴室里用同一个秤测量体重, 测量的结果基本一致,说明信度较高。 但是因为测量的结果比实际重量轻5公斤, 所以测量是无效的。 ◼ 再例如:通过测量人们的脚的尺寸来评 价人的智商,测量的信度很高,却不可 能测量到人的智商