82FREQ过程 8.2.1概述 FREQ过程生成一维至m维的频数表和交叉 表,并能将结果输出至数据集中。 例: SCORE为含学生成绩的数据集,用 VFMI格式把学生的平均成绩分成A、B、C三 等,由FREQ过程产生每一分数段的学生人数和 占总数的百分数等信息
1 8.2 FREQ 过程 8.2.1 概述 FREQ过程生成一维至n维的频数表和交叉 表,并能将结果输出至数据集中。 例: SCORE为含学生成绩的数据集,用 VFMT.格式把学生的平均成绩分成A、B、C三 等,由FREQ过程产生每一分数段的学生人数和 占总数的百分数等信息
PROC FORMAT, VALUE VFMT LOW-<80=C 80-<90=B 90-HIGH=A‘; dATA B SET SASUSER SCORE V=MEANOF TI-T3) PROC FREQ DATA=B FORMATⅤⅤFMT; TABLES V
2 PROC FORMAT ; VALUE VFMT LOW-<80='C' 80-<90='B' 90-HIGH='A‘ ; DATA B; SET SASUSER.SCORE; V=MEAN(OF T1-T3) ; PROC FREQ DATA=B ; FORMAT V VFMT. ; TABLES V;
Cumulative Cumulative Frequency Percent Frequency Percent v-CBA 33.3 573 5 33.3 46.7 12 80.0 20.0 15 100.0
3 Cumulative Cumulative V Frequency Percent Frequency Percent ----------------------------------------------- C 5 33.3 5 33.3 B 7 46.7 12 80.0 A 3 20.0 15 100.0
8.22语句说明 PROC FREQ过程使用如下语句 PROC FREQ选择项列表]; TABLES请求式选择项] WEIGHT变量; BY变量; OUTPUT|选择项|;
4 8.2.2 语句说明 PROC FREQ 过程使用如下语句: PROC FREQ [选择项列表]; TABLES 请求式…[/选择项]; WEIGHT 变量; BY 变量; OUTPUT [选择项];
° PROC FREQ选择项列表l DATA=SAS数据集; ORDER=FREQDATAJINTERNALI FORMATTED FORMCHAR(1,2,7)=字符串 规定用来构造列联表单元的轮廓线和分 割线的字符。(1)垂直线(2)水平线(3) 水平线与垂直交叉线。 缺省, FORMCHAR(1,2,7)=“-+ PAGE每页输出一张表
5 • PROC FREQ [选择项列表]; ▪ DATA=SAS数据集; ▪ ORDER=FREQ|DATA|INTERNAL| FORMATTED ▪ FORMCHAR(1,2,7)=字符串 规定用来构造列联表单元的轮廓线和分 割线的字符。(1)垂直线(2)水平线(3) 水平线与垂直交叉线。 缺省, FORMCHAR(1,2,7)=‘|-+’ ▪ PAGE 每页输出一张表
TABELS请求式</选择项 (1)请求式( request-1ist): 请求式由一个或多个由“*”号联连起 来的变量组成。一维表由一个变量名产生; 二维表由“米”隔开两个变量组成;任何数 量的变量能被“*”连起来得到多维的表格 个FREQ过程可有多个 TABLES语句 每个 TABLES语句也可以有多个请求式
6 •TABELS 请求式 (1)请求式 (request-list): 请求式由一个或多个由“*”号联连起 来的变量组成。一维表由一个变量名产生; 二维表由“*”隔开两个变量组成;任何数 量的变量能被“*”连起来得到多维的表格。 一个FREQ过程可有多个TABLES语句, 每个TABLES语句也可以有多个请求式
°一维频数表:只需在 TAbLES语句中简单地命名 这一变量。例: TABELS X; 二维频数表:在 TABELS语句中用星号“米”连 接两个变量。第一个变量的值形成表的行,而 第二个变量的值形成表的列。 例: TABLES A*B n维列联表:在 TABELS语句中用“*”联接给定 的三个或n个变量名。最后一个变量的值形成 表的列,倒数第二个变量的值形成表的行,其 它变量的每一级水平(或水平组合)形成了一层, 且每层都形成了分立的列联表
7 • 一维频数表:只需在TABLES语句中简单地命名 这一变量。 例: TABELS X; • 二维频数表:在TABELS语句中用星号“*”连 接两个变量。第一个变量的值形成表的行,而 第二个变量的值形成表的列。 例: TABLES A * B; • n维列联表:在TABELS语句中用“*”联接给定 的三个或n个变量名。最后一个变量的值形成 表的列,倒数第二个变量的值形成表的行,其 它变量的每一级水平(或水平组合)形成了一层, 且每层都形成了分立的列联表
(2)选择项 在 TABLES语句的斜杠()后面可使用的选 择项有许多种,现将常用的几种选择项介绍如下: 1)一般选择项: ① MISSING:象分析非缺项值那样分析 缺项值,且在百分数计算和其他统计计算时包括 缺项值。 ②LIST:不是用列联表而是用列表格式 打印二维或多维表格。但当需要统计检验和联合 测量时,不能使用LIST选择项
8 (2)选择项 在TABLES 语句的斜杠(/)后面可使用的选 择项有许多种,现将常用的几种选择项介绍如下: 1) 一般选择项: ① MISSING:象分析非缺项值那样分析 缺项值,且在百分数计算和其他统计计算时包括 缺项值。 ② LIST:不是用列联表而是用列表格式 打印二维或多维表格。但当需要统计检验和联合 测量时,不能使用LIST选择项
2)请求统计分析的选择项 ①CHSQ:请求卡方x2)检验和基于卡方 的有关测量。检验包括 Pearson卡方、似然比 卡方和曼特尔享塞尔( Mantel-haenszel卡方。 测量值包括斐(ph)系数,列联系数和克莱姆 系数 V(Cramer'v)对于2*2表也包括费雪 尔( Fisher精确检验。 ② EXACT:要求对大于2*2的表进行 Fisher精确检验
9 2) 请求统计分析的选择项 ① CHISQ: 请求卡方(χ2 )检验和基于卡方 的有关测量。检验包括Pearson卡方、似然比 卡方和曼特尔-享塞尔(Mantel-Haenszel)卡方。 测量值包括斐( phi)系数,列联系数和克莱姆 系数V(Cramer‘v )。对于 2*2 表也包括费雪 尔(Fisher)精确检验。 ② EXACT:要求对大于2*2的表进行 Fisher精确检验
3)请求增加表格信息及选择项 ① EXPECTED:请求打印在独立(或齐 性)假设下的期望格频数。 ② DEVIATION:请求打印出各格的格 频数和期望值的偏差。 ③ CELLCH:请求打印出每一格对总 (卡方)统计的贡献。 ●●●●●●
10 3) 请求增加表格信息及选择项 ① EXPECTED:请求打印在独立(或齐 性)假设下的期望格频数。 ② DEVIATION:请求打印出各格的格 频数和期望值的偏差。 ③ CELLCHI2:请求打印出每一格对总χ 2 (卡方)统计的贡献。 ……