第2次课一测量与统计基础 (2004-03-18) 集中量 描述统计量差异量 相关量 量表 第二章 误差 测量的基础 测量与统计 信度 效度 常见统计分布函数 SPSS引入
第2次课—测量与统计基础 (2004-03-18)
1.1描述统计量 集中量 描述集中趋势的统计量,叫做“集中量数”,简称“集中量”。 常用的集中量数有三种:算术平均数,中(位)数和众数 差异量 差异量数是描述数据分布中“离中趋势”这一特征的统计量,简称“差异量”。 相关量 在教育研究中,常涉及到两个事物(变量)的相互关系问题,例如,学习 成绩与非智力因素的关系,数学成绩与物理成绩的关系,男女生学习成 绩的关系,等等。 统计学中,就用“相关系数”来从数量上描述两个变量之间的相关程度, 用符号“r”来表示。 相关系数取值范围限于:-1≤r≤+1
1.1描述统计量 集中量 描述集中趋势的统计量,叫做“集中量数”,简称“集中量”。 常用的集中量数有三种:算术平均数,中(位)数和众数。 差异量 差异量数是描述数据分布中“离中趋势”这一特征的统计量,简称“差异量”。 相关量 在教育研究中,常涉及到两个事物(变量)的相互关系问题,例如,学习 成绩与非智力因素的关系,数学成绩与物理成绩的关系,男女生学习成 绩的关系,等等。 统计学中,就用“相关系数”来从数量上描述两个变量之间的相关程度, 用符号“r”来表示。 相关系数取值范围限于:-1≤r≤+1
1.2描述统计量 算术平均数 加权算术平均数 中位数 几何平均数 众数 调和平均数 集中量 (集中趋势) 统计 语言 积差相关系数 (图/表) 全距 差异量 相关量等级相关系数 四分位距离散程度) 致性系y点二列相关系数 二列相关系数 百分位距 ¢相关系数 平均差 四分相关系数 标准差 C相关系数 差异系数 肯德尔和谐相关系数 多相关系数
1.2描述统计量
11集中量 名称 解释优缺点数学计算公式 所有观测值相加除以对每一个观测值加以 观测值的个数。 利用,对极端值敏感。 均值〔mean) 是所有取值的集中趋N 势或中水平 观测值中出现次数最从图表中很容易获 多的值。 取,表明该数出现次 数多,但并未说比其 众数(mode) 它数值多的程度 在描述数据集中趋势 方面由一定的意义 把观测值从小到大排|很容易计算,只需排|(NH+1)2位置上的数 序,中间的那个数就序对极端值不敏感,值 中位数( median 是中位数 既是优点也是缺点。或N2与N2+1位置 上两个数的平均值
1.1集中量
2差异量 名称 解释 数学计算公式 全距(ang) 也程极羑是观测偵最太值与 最小值之间的绝对差 四分位数( quartiles)四分位数是将一组观测值从 十分位数( deciles) 小到大排序后,用3个点将 百分位教( percentiles)全部数据分为四等份,与3 个点上对应的偵程为四分位 数,分别记为Q1、Q2、Q3, 其中Q3到Q1之距离的 半又称为四分位差。以此类 推。十分位数是采用9个点 将一组数分为十等份 (D1.D9),百分位数是采 用99个点将一组数分为100 等份(P1.P99) 所有观测值与平均数之差的 方差( vallance) 平友的平均值 ∑-1(x-x)2 标准差 方差的平方根 (standand deviation) 相对差异量(差异系数)一组观测值的标准差除以算 术平均数
1.2 差异量
2测量基础 教育评价 教育统计 统计分析算法 常用统计分布函数 (正态分布) 集中量差异量相关量 量表 难度 信度 教育 测量 区分度 效度 误差
2.测量基础
2.1量表 表水平特征 惟用 常用的统计方法(描达统计,假设检验) 举例 频百分比,相关系 名称量表同-性和区分性,kB,CE份类,命名 k2(2为指数*验1男:1女2 中位数,百分位数、等级 等级性,位次性,大于或小分等级,位次,排列相关系数,肯德尔和谐系符号检验,秩检验,秩学习成绩:好3中=2差 等级量表千,83,E,AB 顶序 方差分析 单位相等,有人定参照点,无 温度:氏度与度 时季点,(+1k-求等距的度数决定算术平均欺标准积 差等于(氏与疆氏 差异 差相关系数 验,楼验验度之差 从纯对零点开始求差 有纯对零点, 异的度数,决定求比 甲生体重8公斤是乙生体 比率量表13BE,A3 半 几何平均数,差异系数验,检验陇检验重0公斤的2倍 注:下面的量表的性质中包含上面各种量表的性质
2.1量表
22误差 系统误差 在相同的观测条件下作一系列观测,若误差的大小及符号表现出 系统性,或按一定的规律变化,那么这类误差称为系统误差。例 把名义.30m长、而实际长度秀53002m的钢尺文量距离 每量一尺段就要少量2cm,该2cm误差在数值上和符号上都是固 定的,且随着尺段的倍数呈累积性。系统误差对测量成果影响较 大,且一般具有累积性,应尽可能消除或限制到最小程度. ·偶然误差 在相同的观测条件下作一系列观测,若误差的大小及符号都表现 出偶然性,即从单个误差来看,该误差的大小及符号没有规律 但从大量误差的总体来看,具有一定的统计规律,这类误差称为 偶然误差或随机误差。例如用经纬仪测角时,测角误差实际上是 许多微小误差项的总和,而每项微小误差随着偶然因素影响不断 变化,因而测角误差也表现出偶然性。对同一值度的 次观测, 其值不尽相同,观测结果中不可避免地存在着偶然误差的影响
2.2 误差 • 系统误差 – 在相同的观测条件下作一系列观测,若误差的大小及符号表现出 系统性,或按一定的规律变化,那么这类误差称为系统误差。例 如,用一把名义为30m长、而实际长度为30.02m的钢尺丈量距离, 每量一尺段就要少量2cm,该2cm误差在数值上和符号上都是固 定的,且随着尺段的倍数呈累积性。系统误差对测量成果影响较 大,且一般具有累积性,应尽可能消除或限制到最小程度. • 偶然误差 – 在相同的观测条件下作一系列观测,若误差的大小及符号都表现 出偶然性,即从单个误差来看,该误差的大小及符号没有规律, 但从大量误差的总体来看,具有一定的统计规律,这类误差称为 偶然误差或随机误差。例如用经纬仪测角时,测角误差实际上是 许多微小误差项的总和,而每项微小误差随着偶然因素影响不断 变化,因而测角误差也表现出偶然性。对同一角度的若干次观测, 其值不尽相同,观测结果中不可避免地存在着偶然误差的影响
2.3信度 内在信度 指在给定的相同条件下,资料收集、分析和解释能在多大程度上 保持一致。例如,使用多个人收集的资料,内在信度的问题是 研究的材料收集人之间能达成一致吗?如果对学习者进行行为研 究,使用课堂观察方法收集资料,内在信度的问题便是:两个或 更多的观蔡者在看待同一学习者的表现时,能产生相同的看法和 观点吗?观察者之间的协同程度如何?如果缺乏内在信度,资料 仅是收集者个人意义上的一种看法,不能客观地反映真实发生的 清况。 外在信度 涉及的是研究者能否在相同或相似的背景下重复同样的研究,如 果能的话,那么结果是否总能够保持一致?如果研究者在相同方 咨、相冋条件下可以多次得到与先前研究相同的结果,则该研究 是可信的。如果反之,则说明外在信度差
2.3信度 • 内在信度 指在给定的相同条件下,资料收集、分析和解释能在多大程度上 保持一致。例如,使用多个人收集的资料,内在信度的问题是: 研究的材料收集人之间能达成一致吗?如果对学习者进行行为研 究,使用课堂观察方法收集资料,内在信度的问题便是:两个或 更多的观察者在看待同一学习者的表现时,能产生相同的看法和 观点吗?观察者之间的协同程度如何?如果缺乏内在信度,资料 仅是收集者个人意义上的一种看法,不能客观地反映真实发生的 情况。 • 外在信度 涉及的是研究者能否在相同或相似的背景下重复同样的研究,如 果能的话,那么结果是否总能够保持一致?如果研究者在相同方 法、相同条件下可以多次得到与先前研究相同的结果,则该研究 是可信的。如果反之,则说明外在信度差
24效度 内部效度 研究的内部效度是指在研究的自变量与因变量之间存在一定关系 的明确程度。如果自变量和因变量之间关系并不会由于其它变量 存在受到影响,从而变得模糊不清或复杂化,那么这项研究就 有内部效度 外部效度 研究的外部效度是指研究结果能够般化和普遍适用到样本来自 的总体和到其它的总体中的程度,即研究结果和变量条件、时间 和背景的代表性和普遍适用性。外部效度可以细分为总体效度和 生态效度两类
2.4效度 • 内部效度 – 研究的内部效度是指在研究的自变量与因变量之间存在一定关系 的明确程度。如果自变量和因变量之间关系并不会由于其它变量 的存在受到影响,从而变得模糊不清或复杂化,那么这项研究就 具有内部效度。 • 外部效度 – 研究的外部效度是指研究结果能够一般化和普遍适用到样本来自 的总体和到其它的总体中的程度,即研究结果和变量条件、时间 和背景的代表性和普遍适用性。外部效度可以细分为总体效度和 生态效度两类