8.2FREQ过程 8.2.1概述 FREO过程生成一维至n维的频数表和交叉 表,并能将结果输出至数据集中 例:SCORE为含学生成绩的数据集,用 VFMT.格式把学生的平均成绩分成A、B、C三 等,由REQ过程产生每一分数段的学生人数和 占总数的百分数等信息
1 8.2 FREQ 过程 8.2.1 概述 FREQ过程生成一维至n维的频数表和交叉 表,并能将结果输出至数据集中。 例: SCORE为含学生成绩的数据集,用 VFMT.格式把学生的平均成绩分成A、B、C三 等,由FREQ过程产生每一分数段的学生人数和 占总数的百分数等信息
PROC FORMAT; VALUE VFMT LOW-<80='C' 80-<90='B' 90-HIGH='A DATA B; SET SASUSER.SCORE: V=MEAN(OF T1-T3); PROC FREQ DATA=B; FORMAT V VFMT. TABLES V; 2
2 PROC FORMAT ; VALUE VFMT LOW-<80='C' 80-<90='B' 90-HIGH='A‘ ; DATA B; SET SASUSER.SCORE; V=MEAN(OF T1-T3) ; PROC FREQ DATA=B ; FORMAT V VFMT. ; TABLES V;
Cumulative Cumulative Frequency Percent Frequency Percent 5 33.3 5 33.3 7 46.7 12 80.0 3 20.0 15 100.0 3
3 Cumulative Cumulative V Frequency Percent Frequency Percent ----------------------------------------------- C 5 33.3 5 33.3 B 7 46.7 12 80.0 A 3 20.0 15 100.0
8.2.2语句说明 PROC FREQ过程使用如下语句: PROC FREQ[选择项列表]; TABLES请求式../选择项]; WEIGHT变量; BY变量; OUTPUT选择项]; 4
4 8.2.2 语句说明 PROC FREQ 过程使用如下语句: PROC FREQ [选择项列表]; TABLES 请求式…[/选择项]; WEIGHT 变量; BY 变量; OUTPUT [选择项];
·PROC FREQ选择项列表; ■DATA=SAS数据集; ORDER=FREQDATAINTERNAL FORMATTED ·FORMCHAR(1,2,7)=字符串 规定用来构造列联表单元的轮廓线和分 割线的字符。(1)垂直线(2)水平线(3) 水平线与垂直交叉线。 缺省,FORMCHAR(1,2,7)=-+ ·PAGD每页输出一张表 5
5 • PROC FREQ [选择项列表]; ▪ DATA=SAS数据集; ▪ ORDER=FREQ|DATA|INTERNAL| FORMATTED ▪ FORMCHAR(1,2,7)=字符串 规定用来构造列联表单元的轮廓线和分 割线的字符。(1)垂直线(2)水平线(3) 水平线与垂直交叉线。 缺省, FORMCHAR(1,2,7)=‘|-+’ ▪ PAGE 每页输出一张表
TABELS 请求式 </选择项 (1)请求式(request-1ist) 请求式由一个或多个由“*”号联连起 来的变量组成。一维表由一个变量名产生 二维表由“*”隔开两个变量组成;任何数 量的变量能被“*” 连起来得到多维的表格 一个FREQ过程可有多个TABLES语句, 每个TABLES语句也可以有多个请求式。 6
6 •TABELS 请求式 (1)请求式 (request-list): 请求式由一个或多个由“*”号联连起 来的变量组成。一维表由一个变量名产生; 二维表由“*”隔开两个变量组成;任何数 量的变量能被“*”连起来得到多维的表格。 一个FREQ过程可有多个TABLES语句, 每个TABLES语句也可以有多个请求式
维频数表:只需在TABLES语句中简单地命名 这一变量。例:TABELS X: 二维频数表:在TABELS语句中用星号“*”连 接两个变量。第一个变量的值形成表的行,而 第二个变量的值形成表的列 例:TABLES A*B; n维列联表:在TABELS语句中用“*”联接给定 的三个或n个变量名。最后一个变量的值形成 表的列,倒数第二个变量的值形成表的行,其 它变量的每一级水平(或水平组合)形成了一层 且每层都形成了分立的列联表
7 • 一维频数表:只需在TABLES语句中简单地命名 这一变量。 例: TABELS X; • 二维频数表:在TABELS语句中用星号“*”连 接两个变量。第一个变量的值形成表的行,而 第二个变量的值形成表的列。 例: TABLES A * B; • n维列联表:在TABELS语句中用“*”联接给定 的三个或n个变量名。最后一个变量的值形成 表的列,倒数第二个变量的值形成表的行,其 它变量的每一级水平(或水平组合)形成了一层, 且每层都形成了分立的列联表
(2)选择项 在TABLES语句的斜杠()后面可使用的选 择项有许多种,现将常用的几种选择项介绍如下: 1)一般选择项: MISSING:象分析非缺项值那样分析 缺项值,且在百分数计算和其他统计计算时包括 缺项值。 ② LST:不是用列联表而是用列表格式 打印二维或多维表格。但当需要统计检验和联合 测量时,不能使用LST选择项。 8
8 (2)选择项 在TABLES 语句的斜杠(/)后面可使用的选 择项有许多种,现将常用的几种选择项介绍如下: 1) 一般选择项: ① MISSING:象分析非缺项值那样分析 缺项值,且在百分数计算和其他统计计算时包括 缺项值。 ② LIST:不是用列联表而是用列表格式 打印二维或多维表格。但当需要统计检验和联合 测量时,不能使用LIST选择项
2)请求统计分析的选择项 1 CHSQ:请求卡方(2)检验和基于卡方 的有关测量。检验包括Pearson卡方、似然比 卡方和曼特尔-享塞尔Mantel--Haenszel)卡方 测量值包括斐(pi)系数,列联系数和克莱姆 系数V(Cramer'v)。对于2*2表也包括费雪 尔(Fisher)精确检验。 EXACT:要求对大于2*2的表进行 Fisher精确检验。 9
9 2) 请求统计分析的选择项 ① CHISQ: 请求卡方(χ2 )检验和基于卡方 的有关测量。检验包括Pearson卡方、似然比 卡方和曼特尔-享塞尔(Mantel-Haenszel)卡方。 测量值包括斐( phi)系数,列联系数和克莱姆 系数V(Cramer‘v )。对于 2*2 表也包括费雪 尔(Fisher)精确检验。 ② EXACT:要求对大于2*2的表进行 Fisher精确检验
3)请求增加表格信息及选择项 EXPECTED:请求打印在独立(或齐 性)假设下的期望格频数。 DEVIATION:请求打印出各格的格 频数和期望值的偏差 3 CELLCHI2: 请求打印出每一格对总 (卡方)统计的贡献。 ●●●●●● 10
10 3) 请求增加表格信息及选择项 ① EXPECTED:请求打印在独立(或齐 性)假设下的期望格频数。 ② DEVIATION:请求打印出各格的格 频数和期望值的偏差。 ③ CELLCHI2:请求打印出每一格对总χ 2 (卡方)统计的贡献。 ……