Lecture14:SAS简介 张伟平 Monday 14th December,2009
Lecture 14: SAS {0 ‹ï² Monday 14th December, 2009
Contents 1 Introduction 1 2 SAS Language 9 2.1 Proc Step and Data Step...·..·...···.···· 11 2.2 SAS Logical Library.····················· 13 2.2.1 Access SAS file..... 15 2.2.2 View SAS library and file..············· 16 3 SAS Programming 18 3.1 Reading data by DATA STEP 18 3.2 Output format 21 3.3 Manipulate datasets 27 3.3.1 SET statement 27 3.3.2 SORT proc······ 30 3.4 Logical statements ..... 31 3.4.1 IF-THEN statement ... 31 3.4.2 SELECT-WHEN statement.........·.·.. 32 3.4.3DO-ENDS statement..........。.。..·. 33 Previous Next First Last Back Forward 2
Contents 1 Introduction 1 2 SAS Language 9 2.1 Proc Step and Data Step . . . . . . . . . . . . . . . . . . . 11 2.2 SAS Logical Library . . . . . . . . . . . . . . . . . . . . . . 13 2.2.1 Access SAS file . . . . . . . . . . . . . . . . . . . . . 15 2.2.2 View SAS library and file . . . . . . . . . . . . . . . 16 3 SAS Programming 18 3.1 Reading data by DATA STEP . . . . . . . . . . . . . . . . 18 3.2 Output format . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3 Manipulate datasets . . . . . . . . . . . . . . . . . . . . . . 27 3.3.1 SET statement . . . . . . . . . . . . . . . . . . . . . 27 3.3.2 SORT proc . . . . . . . . . . . . . . . . . . . . . . . 30 3.4 Logical statements . . . . . . . . . . . . . . . . . . . . . . . 31 3.4.1 IF-THEN statement . . . . . . . . . . . . . . . . . . 31 3.4.2 SELECT-WHEN statement . . . . . . . . . . . . . . 32 3.4.3 DO-ENDS statement . . . . . . . . . . . . . . . . . . 33 Previous Next First Last Back Forward 2
3.4.4DO-WHILE DO-UNTIL statement.···.···· 35 3.5 OPERATIONS..······················ 36 4 Basic statistical analysis 37 4.1 Descriptive Statistics Proc... 444 37 4.1.1 MEANS proc.··. 39 4.1.2 SUMMARY proc. 41 4.1.3 UNIVARIATE proc 4.1.4 TABULATE PROC 46 4.1.5 GCHART proc··.· 4.1.6 GPLOT proc··· 50 4.2 INFERENTIAL Statistics .. 2 4.2.1T-TEST.... 52 4.2.2 Chi-square tests 4.2.3 Correlation 4.2.4 Regression·············· 54 Previous Next First Last Back Forward 1
3.4.4 DO-WHILE DO-UNTIL statement . . . . . . . . . . 35 3.5 OPERATIONS . . . . . . . . . . . . . . . . . . . . . . . . . 36 4 Basic statistical analysis 37 4.1 Descriptive Statistics Proc . . . . . . . . . . . . . . . . . . . 37 4.1.1 MEANS proc . . . . . . . . . . . . . . . . . . . . . . 39 4.1.2 SUMMARY proc . . . . . . . . . . . . . . . . . . . . 41 4.1.3 UNIVARIATE proc . . . . . . . . . . . . . . . . . . 42 4.1.4 TABULATE PROC . . . . . . . . . . . . . . . . . . 46 4.1.5 GCHART proc . . . . . . . . . . . . . . . . . . . . . 48 4.1.6 GPLOT proc . . . . . . . . . . . . . . . . . . . . . . 50 4.2 INFERENTIAL Statistics . . . . . . . . . . . . . . . . . . . 52 4.2.1 T-TEST . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.2.2 Chi-square tests . . . . . . . . . . . . . . . . . . . . 53 4.2.3 Correlation . . . . . . . . . . . . . . . . . . . . . . . 53 4.2.4 Regression . . . . . . . . . . . . . . . . . . . . . . . . 54 Previous Next First Last Back Forward 1
Chapter 1 Introduction SAS(Statistical Analysis System)系统是用于数据分析和决策支持的大型 集成式模块化软件包. 章历史:最早由北卡罗来纳大学的两位生物统计学研究生编制,并 于1976年成立了SAS软件研究所,正式推出了SAS软件。 章在数据处理和统计分析领域,SAS系统被誉为因际上的标准软件系统,并 在96一97年度被评选为建立数据库的首选产品. 用户:全世界120多个因家和地区的近三万家机构所采用.直接用户则超 过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领 域。 鲁案例:美国FDA新药审批程序=>SAS的权威地位 Previous Next First Last Back Forward
Chapter 1 Introduction SAS(Statistical Analysis System) X⁄¥^uÍ‚©¤⁄˚¸|±å. 8§™¨z^áù. ✿ {§µÅ@dk¤5BåƸ†)‘⁄OÆÔƒ)?õ, ø u1976c§· SAS^áÔƒ§, ™Ì— SAS^á" ✿ 3Í‚?n⁄⁄O©¤+ç, SASX⁄ôèIS˛IO^áX⁄, ø 396*97c›µ¿èÔ·Í‚•ƒ¿¨. ✿ ^rµ.120ıáI[⁄/´Cn[ŧÊ^, Ü^rKá Lnz SAS%/† Previous Next First Last Back Forward ✑
SAS Modules 最新版的SAS提供多达30多个模块(module).比如 SAS/BASE SAS的核心,负责数据管理、交互应用环境管理、用户 语言处理以及调用其他SAS模块.SAS/BASE为SAS的数据库提供了丰富的 数据管理功能,还支持标准的SQL语言对数据进行操作.SAS/BASE不仅能 够制作简单的列表,面且可以制作比较复杂的统计报表.SAS/BASE还可以 进行基本的描述性统计、相关系数的计算,以及进行正态分布检验等」 ◆SAS/STAT SAS/STAT覆盖了所有的实用数理统计分折方法,是国 际统计分析领域的标准软件.SAS/STAT提供了十多个过程,可进行各种不同 模型或不同特点数据的回归分析,且具有多种模型选择方法.可处理的数据有 实型数据、有序数据和属性数据.在方差分析方面,SAS/STAT为多种试验设 计模型提供了方差分析工具.另外,它还有处理一般线性模型和广义线性模 型的专用过程.在多变量统计方面,SAS/STAT为主成分分析、典型相关分 析、判别分析和因子分析提供了许多专用过程.SAS/STAT还包含多种聚类 Previous Next First Last Back Forward
SAS Modules Å#áSASJ¯ıà30ıá¨(module). 'X ✺ SAS/BASE SAS ÿ%ßKIÍ‚+n!pA^Ǹ+n!^r äÛ?n± 9N^Ÿ¶SAS¨. SAS/BASEèSASÍ‚•J¯ ¥L Í‚+nıU, Ñ| ±IOSQLäÛÈÍ‚?1ˆä. SAS/BASEÿ=U õä{¸L, °Öå± õä'E,⁄OL. SAS/BASEÑå± ?1ƒ£„5⁄O!É'XÍO éß±9?1©Ÿu. ✺ SAS/STAT SAS/STAT CX §k¢^Ín⁄O©Úê{, ¥I S⁄O©¤+çIO^á. SAS/STAT J¯ õıáLß, å?1à´ÿ” .½ÿ”A:Í‚£8© ¤, Ö‰kı´.¿Jê{. å?nÍ‚k ¢.Í‚!kSÍ‚⁄·5Í‚. 3ꩤê°,SAS/STAT èı´£ O.J¯ ê© ¤Û‰. , , ßÑk?nòÑÇ5.⁄2¬Ç5 .;^Lß. 3ıC˛⁄ Oê°, SAS/STAT èç©©¤!;.É'© ¤!O©¤⁄œf©¤J¯ Nı ;^Lß. SAS/STAT Ñù¹ı´‡a Previous Next First Last Back Forward ✒
准则的聚类分析方法 ◆SAS/IML SAS/ML提供功能强大的面向矩阵运算的编程语言,帮助 用户研究新算法或解决SAS中没有现成算法的专门问题.SAS/ML中的基本 数据元素是矩阵,它包含大量的数学运算符,函数和例行程序,用户使用很少 的语句便可以执行复杂的计算过程 SAS/GRAPH图形模块.SAS/GRAPH可将数据及其包含若的深层 信总以多种图形生动地呈现出来,如直方图、饼分图、星形图、散点图、曲 线图、三维曲面团、等高线图及地理图等.SAS/GRAPH提供一个全屏幕编 辑器,提供多种设备程序,支持非常广泛的图形输出设备 ●SAS/ACCESS外部数据库接口模块,提供了与大多数数据库管理系 统连接的接口,并且其自身也能进行数据管理 其他的模块如SAS/计量经济学和时间序列分析,SAS/运筹学,SAS/投资 分析,SAS/实验设计,SAS/市场研究,SAS/项目管理等等 Previous Next First Last Back Forward 3
OK‡a©¤ê{. ✺ SAS/IML SAS/IML J¯ıUrå°ï› $é?ßäÛ, êœ ^rÔƒ#é{½)˚SAS•vky§é{;ÄØK. SAS/IML•ƒ Í‚É¥› , ßù¹ å˛ÍÆ$éŒ, ºÍ⁄~1ßS, ^r¶^È äÈBå±â1E,OéLß. ✺ SAS/GRAPH „/¨. SAS/GRAPH åÚÍ‚9Ÿù¹X &E± ı´„/)ƒ/•y—5, XÜê„!\©„!(/„!—:„! Ç„!në°Ï!pÇ„9/n„. SAS/GRAPH J¯òá¶4? 6Ï, J¯ı´ßS, |±ö~2ç„/——. ✺ SAS/ACCESS ‹Í‚•ù¨, J¯ ÜåıÍÍ‚•+nX ⁄Î ù, øÖŸgèU?1Í‚+n. Ÿ¶¨XSAS/O˛²LÆ⁄ûmS©¤, SAS/$ Æ, SAS/›] ©¤, SAS/¢O, SAS/½|Ôƒ, SAS/ë8+n. Previous Next First Last Back Forward 3
SAS特点 1.信息存储简便灵活 SAS能和绝大多数数据库系统交换数据信息,具有很强的数据共享能力.数 据导入后,分析功能非常强大 2.语言编程能力强 SAS语言功能强大,内含100多种函数和丰富的算术逻辑运算符值语句、 条件语句、数组和循环语句等对变量进行各种操作, SAS语言有两类,即DATA语句和PROC语句.SAS程序以DATA语句 开始,输入或处理有关的数据集(SAS的数据文件).让系统读入有关数据. DATA语句的部分叫数据步.PROC语句用于指出对哪种数据进行分析. PROC语句的部分叫过程步,利用系统提供的过程(SAS提供的数据分析子程 序)进行分析. 3.丰言的统计分析方法 统计分折是SAS的主要功能.它几乎囊括了所有的统计方法,从基本统计到 Previous Next First Last Back Forward 4
SAS A: 1. &E;{B(¹ SASU⁄˝åıÍÍ‚•X⁄ÜÍ‚&E,‰kÈrÍ‚êUÂ. Í ‚\, ©¤ıUö~rå. 2. äÛ?ßUÂr SAS äÛıUrå, S¹100ı´ºÍ⁄¥Lé‚‹6$éŒ ääÈ! ^áäÈ!Í|⁄ÃÇäÈÈC˛?1à´ˆä. SASäÛk¸a, =DATAäÈ⁄PROCäÈ. SASßS±DATAäÈ m©, — \½?nk'Í‚8(SASÍ‚©á). 4X⁄÷\k'Í‚. DATAäÈ‹© Í‚⁄. PROC äÈ^uç—È=´Í‚?1©¤. PROC äÈ‹©Lß⁄, |^X⁄J¯Lß(SAS J¯Í‚©¤fß S)?1©¤. 3. ¥L⁄O©¤ê{ ⁄O©Ú¥SASÃáıU. ßAK) §k⁄Oê{, lƒ⁄O Previous Next First Last Back Forward 4
多元分析,从预测预报到运筹决策,从时序分析到经济计量等 SAS只需通过菜单的选择、对话框的操作告诉系统要做什么,而无须告之 怎样做.只要初步了解统计分析原理,无须通统统计分析的各种算法,即可得 到统计分析结果。 4.较强的统计报表与绘图功能 SAS支持绘制1一3维表格,它既可以各种格式输入数据,也可以任何方式 输出表格.SAS可以绘制各种统计图形. 5.友好的用户界面 SAS提供了一系列灵活的菜单驱动,面向任务的图形界面,初学者和熟练 的SAS用户都可以全面地进行以数据为中心的基本处理.SAS采用多窗口的 操作环境和显示方式,远行一个SAS程序时,用户可以从不同的窗口中了解程 序的运行情况、出错信息和输出结果.对于数据和文件,也各有窗口管理和显 示 6.宏功能 Previous Next First Last Back Forward 5
ı ©¤, l˝ˇ˝$ ˚¸, lûS©¤²LO˛. SAS êIœL˸¿J!È{µˆäwäX⁄áâ üo, ÃLwÉ Nâ. êá–⁄ )⁄O©¤n, ÃLœ⁄⁄O©¤à´é {, =å ⁄O©¤(J. 4. r⁄OLܱ„ıU SAS |±±õ1)3ëLÇßßQå±à´Ç™—\Í‚, èå±?¤ê™ ——LÇ. SAS å±±õà´⁄O„/. 5. l–^r.° SAS J¯ òX(¹Ë¸°ƒ, °ï?÷„/.°, –ƈ⁄Ÿˆ SAS ^r—å±°/?1±Í‚è•%ƒ?n. SAS Ê^ıIù ˆäǸ⁄w ´ê™, 1òáSASßSû, ^rå±lÿ”Iù• )ß S$1ú¹!—Ü &E⁄——(J. ÈuÍ‚⁄©á, èàkIù+n⁄w ´. 6. ˜ıU Previous Next First Last Back Forward 5
SAS有较强的宏代换功能.如果用户需要多次做类似的工作,其中仅是参 数不同,则可以使用宏功能定义宏体,在宏体中可以使用宏变量.随后,用户 就可以使用不同的参数载人宏体,从而大大简化了程序的编写. 7.支持分布式处理 SAS支持分布式处理,多台计算机协同工作,有效减少了大数据量的统计 分析所需的时间,并能充分享用网络环境中的软件及硬件资源 8.采用输出分发系统 所有的输出都由输出分发系统处理,它允许用户自己定制显示哪些结果,输 出分发系统可以生成多种格式的结果,包括HTML文件. 9.功能强大的系统阅读器 SAS阅读器是一个浏览SAS各类文件的应用软件.它提供了一个快速、便 利的查看打印数据集、目录、传施文件、SAS程序、工作日志、输出结果 等内容的通道,用户不必运行SAS,甚至不需要在计算机中安装SAS,即可浏 览SAS的各类文件. Previous Next First Last Back Forward 6
SAS kr˜ìÜıU. XJ^rIáıgâaqÛä, Ÿ•=¥Î Íÿ ”, K屶^˜ıU½¬˜N, 3˜N•å±¶^˜C˛. ë, ^r “屶^ ÿ”ÎÍ1<˜N, l åå{z ßS?. 7. |±©Ÿ™?n SAS |±©Ÿ™?n, ıOéÅ”Ûä, k~ åÍ‚˛⁄O ©¤§ Iûm, øUø©ê^‰Ç¸•^á9Má] . 8. Ê^——©uX⁄ §k———d——©uX⁄?n, ß#N^rgC½õw´= (J, — —©uX⁄å±)§ı´Ç™(J, ù)HTML©á. 9. ıUråX⁄÷Ï SAS ÷Ï¥òáËASASàa©áA^^á. ßJ¯ òáØÑ!B | wã<Í‚8!8¹!Dñ©á!SAS ßS!ÛäFì!——(J SNœ, ^r ÿ7$1SASß$ñÿIá3OéÅ•SCSAS, =åË ASASàa©á. Previous Next First Last Back Forward 6
SAS启动后界面如下图: SAS 国回☒ 文件0篇城)视图的工具T)节解方案5)留口0桥动D D论日鲁A米h应取X0多 方数安更唐 5环填的内留 有 逻摄犀文件建方 a 中 OTE: 天为呢轮 1编得器一无标前1 ▣☒ 55连楼管a圆输出-(无移是)日日志。(无标题西编辑远一无标1 C:\Docmentz ud Sattir Is 1,Col 1 Previous Next First Last Back Forward 7
SASȃ.°Xe„: Previous Next First Last Back Forward 7