第二章SAS编程基础 Basic Programming of SAS 主讲人:李桥
第二章 SAS编程基础 Basic Programming of SAS 主讲人:李桥
主要内容 ■SAS数据集、常量、变量与观测 ■SAS函数 ■ SAS操作符 ■数据步流程
主要内容 ◼ SAS数据集、常量、变量与观测 ◼ SAS函数 ◼ SAS操作符 ◼ 数据步流程
SAS数据集、常量、变量与观测 数据集(Dataset) SAS数据集是SAS可以管理的结构化的数据,只有SAS 数据集中的数据才能被SAS过程步处理。 ■ 数据集包含两部分内容: 1.描述部分:(数据结构) 数据名称、类型、长度、格式等。 2.数据部分:(数据) 包含实际数据值。 SAS数据值被安排在一个矩阵式的表状结构中
SAS数据集、常量、变量与观测 ◼ 数据集(Dataset) ◼ SAS数据集是SAS可以管理的结构化的数据,只有SAS 数据集中的数据才能被SAS过程步处理。 ◼ 数据集包含两部分内容: 1. 描述部分: (数据结构) 数据名称、类型、长度、格式等。 2. 数据部分: (数据) 包含实际数据值。 SAS数据值被安排在一个矩阵式的表状结构中
变量 变量名 E S置 A宽 匹IT EI纽T 观测1 ZHANGL IN H 38 172.4 61.5 观测2 WANGQANG N 41 169.2 64.5 观测3 LIULI F 52 158.2 53.6 观测4 SHIDONG F 39 160.1 48.0 观测5 KONGYING N 29 174.1 64.6 观测6 LILING F 37 152.3 42.2 观测7 GUANFEN N 32 166.2 60.2 观测8 MAQIANG M 26 180.3 74.3 观测9 NEWHUA M 31 178.2 80.2 观测10 TANGNEU F 35 169.2 60.8 观测11 GENGJIE M 24 176.0 73.3 观测12 SUNHONG F 27 158.3 49.9 观测13 DONGLIN F 33 162.4 51.6 观测14 TONGLING M 34 170.4 58.9
观测(Observation) 描述被观测对象的单一整体(如一个人、 一个实验动物等)某些所研究特性的一系列数 据值称为一个观测,又称观察。在SAS数据集 中每一行数据是一个观测。 变量Variable) 变量指定了数据的某一特性。在SAS数据 集中,每一个观测是由各个变量的数据值组成。 在数据集中每一列数据是一个变量
◼ 观测(Observation) 描述被观测对象的单一整体(如一个人、 一个实验动物等)某些所研究特性的一系列数 据值称为一个观测,又称观察。在SAS数据集 中每一行数据是一个观测。 ◼ 变量(Variable) 变量指定了数据的某一特性。在SAS数据 集中,每一个观测是由各个变量的数据值组成。 在数据集中每一列数据是一个变量
变量的命名 变量名最多8个字符长,一般由字母、数 字、下划线组成。第一个字符必须是字母或者 下划线,不能有空格。特殊字符(如$,@,) 也不允许在SAS名中使用 合法变量名如: A A1 abc name age total SAS系统保留的特殊变量名,以下划线开始和 结尾。如:_N和ERROR等
◼ 变量的命名 变量名最多8个字符长,一般由字母、数 字、下划线组成。第一个字符必须是字母或者 下划线,不能有空格。特殊字符(如$,@,#) 也不允许在SAS名中使用。 合法变量名如: A A1 abc name age total … SAS系统保留的特殊变量名,以下划线开始和 结尾。如:_N_和_ERROR_等
变量特性 变量特性:名称、类型、长度、输入格式、输 出格式和标记。 ■两种类型:数值型 字符型(后跟“$”符号) 长度特性:是指存贮的字节数。缺省长度是8 (为 了存贮长度与缺省值不同的变量,需使用LENGTH 语句)
◼ 变量特性 变量特性:名称、类型、长度、输入格式、输 出格式和标记。 ◼ 两种类型:数值型 字符型(后跟“$”符号) ◼ 长度特性:是指存贮的字节数。缺省长度是8 (为 了存贮长度与缺省值不同的变量,需使用LENGTH 语句)
■定义变量特性的两种方法: ■ 明确地说明-input语句 ■在首次出现时给出定义一赋值语句:等号= ■例如: DATA A; C='BAD'; PUT C; C='GOOD'; PUT C; RUN;
◼ 定义变量特性的两种方法: ◼ 明确地说明– input 语句 ◼ 在首次出现时给出定义– 赋值语句:等号= ◼ 例如: DATA A; C='BAD'; PUT C; C='GOOD'; PUT C; RUN;
变量清单的简化表示 如果要一次定义或指定多个同种类型变量,可以使 用缩写变量清单形式:P13表2-1) INPUT NAME VAR1 VAR2 VAR3 VAR4 VAR5 VAR6; 可以写成: INPUT NAME$VAR1-VAR6; 注意:字符型变量NAME不包含在这个缩写清单中。 这些变量要求类型相同,或全是数值型的或全是字 符型的
◼ 变量清单的简化表示 如果要一次定义或指定多个同种类型变量,可以使 用缩写变量清单形式: (P13表2-1) INPUT NAME $ VAR1 VAR2 VAR3 VAR4 VAR5 VAR6; 可以写成: INPUT NAME $ VAR1-VAR6; 注意: 字符型变量NAME不包含在这个缩写清单中。 这些变量要求类型相同,或全是数值型的或全是字 符型的
缺项值 当一个变量由于某种原因没有得到(可能 没有观测到,或由于数据错误,或由于计算错 误),称该值为缺项值(又称缺失值)。在 SAS中用“”表示
◼ 缺项值 当一个变量由于某种原因没有得到(可能 没有观测到,或由于数据错误,或由于计算错 误),称该值为缺项值(又称缺失值)。在 SAS中用“.”表示