相关统计学概念(2) 频数( frequency):各组段内的数据个数,频数分布类型 有正态,左偏态和右偏态 算术均数(mean):总体均数μ,样本均数x 几何均数( geometric mean):原始数据分布不对称,但 经对数转换后呈对称分布的数据。几何均数G 中位数( median):指将一组数值从小到大排序后居于 中间位置的那个数值。中位数M 极差( range):全距R,描述数据的分布范围,极差大说 明数据分布较分散 四分位数间距( inter-quartile range):g与Q的差距
•频数(frequency):各组段内的数据个数,频数分布类型 有正态,左偏态和右偏态 •算术均数(mean):总体均数,样本均数X •几何均数(geometric mean):原始数据分布不对称,但 经对数转换后呈对称分布的数据。几何均数G •中位数 (median):指将一组数值从小到大排序后居于 中间位置的那个数值。中位数M •极差(range):全距R,描述数据的分布范围,极差大说 明数据分布较分散 •四分位数间距(inter-quartile range): QU与QL的差距 相关统计学概念(2)
百分位数( percentile):Px,如P23,Ps等 四分为数:Q(下四分位数,25%),Qu(上四分 位数,75%) 方差( varlance):样本方差s2,总体方差o 标准差( standard deviation):标准差S替代方差描述数据 分布的离散程度 变异系数( coefficient of variation):Cv,标准差与算术 均数之比,它描述数据分布的相对离散程度 标准误( standard error,SE)与均数的标准误( standard error of mean,SEM):均数的标准误与标准差成正 比,与样本例数m的平方根成反比
百分位数(percentile):Px ,如P25,P50等 四分为数:QL(下四分位数,25%),QU(上四分 位数,75%) •方差(variance):样本方差S 2,总体方差 2 •标准差(standard deviation):标准差S替代方差描述数据 分布的离散程度 •变异系数(coefficient of variation):CV,标准差与算术 均数之比,它描述数据分布的相对离散程度。 •标准误(standard error,SE)与均数的标准误( standard error of mean,SEM ):均数的标准误与标准差成正 比,与样本例数n的平方根成反比
频数表分析( Frequencies过程) Frequencies分析过程可产生频数分布图、条邢图、饼图 直方图、计算任意百分位数、分布参数估计值、集中趋势与 离散趋势等各项统计学指标。 Analyze /Descriptive Statistics/Frequencies Variable(s) 粉身高 [cm) [height a统计 Reset Cancel 图表 显 Help 格式化 频 Display frequency tables 表 Statistics… Charts… Format
频数表分析( Frequencies过程 ) Frequencies分析过程可产生频数分布图、条形图、饼图、 直方图、计算任意百分位数、分布参数估计值、集中趋势与 离散趋势等各项统计学指标。 Analyze / Descriptive Statistics / Frequencies… 统计… 图表… 格式化… 显 示 频 数 表
某市1982年110名7岁男童的身高资料 1130 1182 1189 1203451147 1148 113.2 1197 24270四 1198 1197 114391 1170 1198 1280 126.1 124.1 1218 1200 1266491305 1190 1149 118.4 14 1160 1244 1252 1258 1154 1179 118.4 120.1 1185 120.8 1238 1228 1174 可四7277万7 122.1 1180 01163321205 123.1 1103 25.0 1168 1205 1205 1163 1172 1230 1108 108.2 100 118.1 118335 116.2 119.7 1195 200 1168 5812078122010 1225 15 1229 371215 1177 1293 103 161208 1200 1200 1143104 1172 17 1164 117.1 61 129.1 1132 120.4 1149 9044 112.2 1163 1210 120.1 8 112.4 1130 107 119.1 120.7 1262 125.2 108 120.7 125 414365122487 1193 1115 22125544 1195 66 127.1 1325 序号数据 cm
某市1982年110名7岁男童的身高资料: 序号 数据cm
Frequencies: Statistics Percentile values Central Tendency Continue 统计 Quartiles V Me Cancel Cut points for 10 equal groups v Media elp y Percentile(s): V Mode Add 2.5 M Sum 97.5 Change Remove Values are group midpoints Dispersion Distribution v Std deviation Minimum V Skewness 正态曲线 v Varian V Maximum Kurtosis V Range 问sE,mean Frequencies: Charts Chart Type Continue Cancel 条形图 C Bar charts Help C Pie charts 饼图 C Histograms 直方图 V With normal curvel Chart values- 图表 C Frequencies C Percentages
统计… 图表… 直方图 饼图 条形图 正态曲线
频数表 身高的各项统计学指标 身高(cm) 108.2 值 110.3 统计表 1108 9999 2.7 36 身高(cm 112.2 9 4.5 Valid 110 1124 Missing 112.7 11111121223122 9 532 119.725 1130 18 Std. error of meam 452 1132 18 18 118 Median 119.900 Mode 120.0 9 155 集中趋势指标 1148 Std. deviation 4.741 114.9 18 18 Variance 22.479 115.4 Skew ness偏度系数 Std. Error of skewness 离散趋势指标 1256 230 1258 Ku0峰度系数/分布参数估计值 -.025 9999 9qqgq 909 918 Std. Error of Kurtosis 457 92.7 936 127,1 945 Minimum 108.2 ,9 955 Maximum 132.5 129,1 Sum 131698 129,3 973 Percentiles 2.5 1305 111111111111 110.688 q-qqqqq 1308 99g 99.1 116.375 四分位数 119900 合计 110 1000 100. 122.800 97.5 130.568
统 计 表 身 高(cm) 110 0 119.725 .452 119.900 120.0 4.741 22.479 .156 .230 -.025 .457 24.3 108.2 132.5 13169.8 110.688 116.375 119.900 122.800 130.568 Valid Missing N Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum 2.5 2 5 5 0 7 5 97.5 Percentiles 频数表 身高的各项统计学指标 集中趋势指标 偏度系数 离散趋势指标 峰度系数 分布参数估计值 四分位数
某城市7岁男童身高直方图 身高(cm) 正态曲线一 10 Std Dev 4.74 Mean =119.7 0 N=110.00 10801120116.0 1280132.0 110011401180122.0126.0130.0 身高(cm)
身 高(cm) 132.0 130.0 128.0 126.0 124.0 122.0 120.0 118.0 116.0 114.0 112.0 110.0 108.0 身高(cm) 频数 30 20 10 0 Std. Dev = 4.74 Mean = 119.7 N = 110.00 某城市7岁男童身高直方图 正 态 曲 线
描述性统计分析( Descriptives过程) Descriptive分析过程可计算数值变量的描述性统计量 均数、总和、标准差、方差、全距、最小值、最大值、标准 误、峰度系数、偏度系数及标准化(Z值、Z分数)。 Analyze/Descriptive Statistics /Descriptives 秒编号 Variable[s] OK 住院号[nno 静年龄[age 入院日期[ indate 身高队 Paste 静>病情分级区 →体重区2] Descriptives:Options 静收缩压区3 Reset 厂Sum Continue 舒张压区4 空腹血糖区5] Cancel Dispersion Cancel 胰岛素样生长因子-1 V Std deviation Minimum 秒sex='男[ FILTER[fl Help Help T Variance V S.E. mean Save standardized values as variables Options Distribution 厂 Kurtosis 厂 Skewness Display Order C Variable list C Alphabetic C Descending means
描述性统计分析(Descriptives过程) Descriptive分析过程可计算数值变量的描述性统计量: 均数、总和、标准差、方差、全距、最小值、最大值、标准 误、峰度系数、偏度系数及标准化(Z值、Z分数)。 Analyze / Descriptive Statistics / Descriptives…
Data/ Select Cases./If condition is satisfied sex=2 男性个体年龄、身高、体重的描述性统计量 Minimum Maximum Std Statistic Statistic Statistic Statistic Statistic Std Eor Statistic 年龄 12 51.6 23.0 74.6 49.617 4.44015.380 身高 18.0 160.0 178.0168.375 1.531 5.305 体重 28.0 52.0 0.063.933 2.323 8.047 Valid n(listw ise Data/ Select Cases./All Cases 全部个体年龄、身高、体重的描述性统计量 Minimum Maximum Mean Std Statistic Statistic Statistic Statistic Statistic Std. Eor Statistic 年龄 24 51.6 23.0 74.6 50.246 3.487 17.082 身高 24 34.5 143.5 178.0160.479 1994 9.767 体重 24 41.5 0058821 1.987 9.733 Valid n (list ise 24
全 部 个 体 年 龄 、 身 高 、 体 重 的 描 述 性 统 计 量 2 4 51.6 23.0 74.6 50.246 3.487 17.082 2 4 34.5 143.5 178.0 160.479 1.994 9.767 2 4 38.5 41.5 80.0 58.821 1.987 9.733 2 4 年 龄 身 高 体 重 Valid N (listwise) Statistic Statistic Statistic Statistic Statistic Std. Error Statistic N Range Minimum Maximum Mean Std. Deviation Data / Select Cases… / If condition is satisfied sex=‘男’ Data / Select Cases… / All Cases 男 性 个 体 年 龄 、 身 高 、 体 重 的 描 述 性 统 计 量 1 2 51.6 23.0 74.6 49.617 4.440 15.380 1 2 18.0 160.0 178.0 168.375 1.531 5.305 1 2 28.0 52.0 80.0 63.933 2.323 8.047 1 2 年 龄 身 高 体 重 Valid N (listwise) Statistic Statistic Statistic Statistic Statistic Std. Error Statistic N Range Minimum Maximum Mean Std. Deviation
平均数分析( Means过程) Means过程可分组计算指定变量的描述性计算如:均数、 总和、标准差、方差、观察例数等;可进行单因素随机设计 方差分析( One-way analysis of variance)和线性检验(Test for linearity Analyze/ Compare Means/ Means….因变量列表 Means 第一层 秒编号 Dependent List OK 参住院号[nno 带体重k2 以病情 秒入院日期[ indate 糁空腹血糖区5 Paste 丛性别sex] 分级进 参收缩压区3 Reset 舒张压区4 行分组◆胰岛素样生长因子1 Previous Layer11Nb Cancel Help Independent List ⊕病情分级 Options… 自变量列表
平均数分析(Means过程) Means过程可分组计算指定变量的描述性计算如:均数、 总和、标准差、方差、观察例数等;可进行单因素随机设计 方差分析(One-way analysis of variance)和线性检验(Test for linearity)。 第一层: 以病情 分级进 行分组 自变量列表 Analyze / Compare Means / Means … 因变量列表