《教育科学研究方法》课程教学课件（访谈法）SPSS讲义02 第2章变量、数据文件、系统参数.doc_大学文库

第2章变量、数据文件、系统参数 SPSS对数据的处理是以变量为前提的，因此本章首先介绍定义变量、输入数据，再介绍保存数据、操作数据文件，最后介绍SPSS运行环境和系统参数的设置， 2.1定义变量启动SPSS后，出现如图21所示数据编辑窗口。由于目前还没有输入数据，因此显示的是一个空文件。图2-1数据编辑窗口输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度（小数位数)、变量标签（或值标签）和变量的格式。单击数据编辑窗口左下方的“Variable View”标签或双击列的愿头(ar),进入如图2-2所示的变量定义视图窗口，在此窗口中即可定义变量。图2-2变量定义视图窗口 2.1.1变量的定义信息在图2-2所示的窗口中每一行表示一个变量的定义信息，包括Name、ype、Wdh Decimal、Label、Values、Missing、Columns、Align、Measure等。 1.定义变量名(Name) SPSS默认的变量为r00001、ar00002等，用户也可以根据自己的需要来命名变量。 SPSS变量的命名和一般的编程语言一样，有一定的命名规则，具体内容如下。变量名必须以字母、汉字或字符@开头，其他字符可以是任何字母、数字或、@、 #、$等符号。变量最后一个字符不能是句号。变量名总长度不能超过8个字符（即4个汉字）。不能使用空白字符或其他特殊字符（如“：”、“？”等）。变量命名必须惟一，不能有两个相同的变量名。在SPSS中不区分大小写。例如，XH、hh或h对SPSS而言，均为同一变量名称。图2-3定义变量类型对话框 SPSS的保留字(Reserved Keywords)不能作为变量的名称，如ALL、AND、WITH、 OR等， 2.定义变量类型(ype) 单击Typ沁相应单元中的按钮，弹出如图2-3所示的对话框，在对话框中选择合适的变量类型并单击“OK”按钮，即可定义变量类型。图2-3定义变量类型对话框 SPSS的主要变量类型如下

第 2 章变量、数据文件、系统参数 SPSS 对数据的处理是以变量为前提的，因此本章首先介绍定义变量、输入数据，再介绍保存数据、操作数据文件，最后介绍 SPSS 运行环境和系统参数的设置。 2.1 定义变量启动 SPSS 后，出现如图 2-1 所示数据编辑窗口。由于目前还没有输入数据，因此显示的是一个空文件。图 2-1 数据编辑窗口输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度（小数位数）、变量标签（或值标签）和变量的格式。单击数据编辑窗口左下方的“Variable View”标签或双击列的题头（Var），进入如图 2-2 所示的变量定义视图窗口，在此窗口中即可定义变量。图 2-2 变量定义视图窗口 2.1.1 变量的定义信息在图 2-2 所示的窗口中每一行表示一个变量的定义信息，包括 Name、Type、Width、 Decimal、Label、Values、Missing、Columns、Align、Measure 等。 1．定义变量名（Name） SPSS 默认的变量为 Var00001、Var00002 等，用户也可以根据自己的需要来命名变量。 SPSS 变量的命名和一般的编程语言一样，有一定的命名规则，具体内容如下。变量名必须以字母、汉字或字符@开头，其他字符可以是任何字母、数字或_、@、 #、$等符号。变量最后一个字符不能是句号。变量名总长度不能超过 8 个字符（即 4 个汉字）。不能使用空白字符或其他特殊字符（如“！”、“？”等）。变量命名必须惟一，不能有两个相同的变量名。在 SPSS 中不区分大小写。例如，HXH、hxh 或 Hxh 对 SPSS 而言，均为同一变量名称。图 2-3 定义变量类型对话框 SPSS 的保留字（Reserved Keywords）不能作为变量的名称，如 ALL、AND、WITH、 OR 等。 2．定义变量类型（Type）单击 Type 相应单元中的按钮，弹出如图 2-3 所示的对话框，在对话框中选择合适的变量类型并单击“OK”按钮，即可定义变量类型。图 2-3 定义变量类型对话框 SPSS 的主要变量类型如下

2.42指定加权变量在实际的统计中，经常需要计算数据的加权平均数。例如，希望了解某超市中某天售出商品的平均价格。如果仅以各种商品的单价平均数作为平均价格是不合理的，还应考虑到各商品的销售量对平均价格的影响。因此，以商品的销售量作为权重计算各种商品单价的加权平均数，才是我们需要求的数据。在SSS处理中就需要将商品销售量作为加权变量图2-22“Weight Cases”"对话框 2.43根据已存在的变量建立新变量在数据统计中，有时候经常需要通过数据转换来提示变量之间的真实关系。这时需要通过对已经存在的变量进行处理，从而生成新的变量。选择“Transform”莱单的“Compute ariable”项，弹出如图2-23所示的“Compute Variable”(i计算变量)对话框。在该对话框中的“Target Variable(目标变量)”框中输入符合变量命名规则的变量名，目标变量可以是现存变量或新变量。图2-23“Compute Variable”(计算变量)对话框图2-24条件表达式对话框 2.44产生计数变量在统计过程中，往往需要进行一些计数工作。产生计数变量就是实现计数功能，它对所有个案或满足一定条件的个案，计算若干个变量中有几个变量的值落在指定的区间内，并将计数结果放入一个新变量中。图2-25“Count Occurrences of Values within Cases”"对话框图2-26 “Count Values within Cases:alues to Count”对话框图2-27指定条件来确定参与计数的个案图2-28增加了一个计数结果列j 2.4.5变量的重新赋值在数据编辑过程中，用户可对个案的某个变量的数值重新赋予新值。这种操作只适用于数值型变量。在“Transform”菜单中的有“Into Same Variables”和“Into Different Variables”两种赋值方法供选择。其中“Into Same Variables'”是对变量自身重新赋值：“Into Different Variables" 是赋值到其变量或新生成的变量。图2-29“Recode into Same Variables”对话框图2-30“Recode into Same Variables:Old and New Values”对话框在上述两种赋值情况下，用户均可通过单击“”按纽指定条件，米确定参与重新赋值的个案。与前面根据已存在的变量建立新变量方法不同的是：变量的重新赋值Recode不能进行

2.4.2 指定加权变量在实际的统计中，经常需要计算数据的加权平均数。例如，希望了解某超市中某天售出商品的平均价格。如果仅以各种商品的单价平均数作为平均价格是不合理的，还应考虑到各商品的销售量对平均价格的影响。因此，以商品的销售量作为权重计算各种商品单价的加权平均数，才是我们需要求的数据。在 SPSS 处理中就需要将商品销售量作为加权变量。图 2-22 “Weight Cases”对话框 2.4.3 根据已存在的变量建立新变量在数据统计中，有时候经常需要通过数据转换来提示变量之间的真实关系。这时需要通过对已经存在的变量进行处理，从而生成新的变量。选择“Transform”菜单的“Compute Variable”项，弹出如图 2-23 所示的“Compute Variable”（计算变量）对话框。在该对话框中的“Target Variable（目标变量）”框中输入符合变量命名规则的变量名，目标变量可以是现存变量或新变量。图 2-23 “Compute Variable”（计算变量）对话框图 2-24 条件表达式对话框 2.4.4 产生计数变量在统计过程中，往往需要进行一些计数工作。产生计数变量就是实现计数功能，它对所有个案或满足一定条件的个案，计算若干个变量中有几个变量的值落在指定的区间内，并将计数结果放入一个新变量中。图 2-25 “Count Occurrences of Values within Cases”对话框图 2-26 “Count Values within Cases：Values to Count”对话框图 2-27 指定条件来确定参与计数的个案图 2-28 增加了一个计数结果列 lj 2.4.5 变量的重新赋值在数据编辑过程中，用户可对个案的某个变量的数值重新赋予新值。这种操作只适用于数值型变量。在“Transform”菜单中的有“Into Same Variables”和“Into Different Variables”两种赋值方法供选择。其中“Into Same Variables”是对变量自身重新赋值；“Into Different Variables” 是赋值到其变量或新生成的变量。图 2-29 “Recode into Same Variables”对话框图 2-30 “Recode into Same Variables：Old and New Values”对话框在上述两种赋值情况下，用户均可通过单击“If”按钮指定条件，来确定参与重新赋值的个案。与前面根据已存在的变量建立新变量方法不同的是：变量的重新赋值 Recode 不能进行

运算，只能根据指定变量值作数值转换，且这种转换是单一数值的转换。图2-3引“Recode into Different Variables”对话框图2-32“Recode into Different Variables:Old and New Values'”对话框 2.46变量的自动赋值(Automatic Recode)》变量的自动赋值可以将字符型、数字型数值转变成连续的整数，并将结果保存在一个新的变量中，其中字符型数据按照字母的顺序排序。图2-33“Automatic Recode”对话框图2-34确定变量图2-35运行结果 2.47变量定义信息的查询在SPSS数据编辑窗口中的“Variable View”标签中可以看到变量的定义信息，在其中还可以进行修改。在SPSS的“Utitis”莱单中还提供了变量信息的查询功能。图2-36“Variables”对话框 2.4.8变量集的定义和使用在SPSS的统计过程中，有时候收集到的变量会有很多个。在进行各种数据处理和统计分析时，所有变量都会显示在各个处理对话框的变量列表框中供用户选择。在众多变量中选择几个变量进行处理以及分析是很麻烦的，尤其是对于某几个经常需要进行操作的变量。 SPSS提供了变量集(Variable Set)的概念，可以很好地解决上面所提出的问题。 1.变量集的定义所谓变量集是指一些变量的集合。比如我们收集了某班级同学众多科目的成绩，可以把这些科目分为理科、文科、自然科学等，这其实就是变量集的概念。 SPSS变量集有两类：系统变量集和用户自定义变量集。系统变量集是SPSS系统已经定义好的，它包括以下两个集合。 ALL VARIABLES:存放数据编辑窗口中所有的变量。 NEW VARIABLES::存放数据编辑窗口中所有尚未保存的新定义变量，用户自定义变量集是用户根据实际数据分析需要定义的，它可以有许多个。一般把需要经常处理的、处理过程类似的若干个变量存放在一个用户自定义变量集中。 2.定义用户变量集要将数学、物理、化学归到一个用户定义变量集中，名称为理科，具体操作的过程如下。图2-37“Define Variable Sets'”对话框 3.用户变量集的使用如果仅仅定义用户变量集，而没有指定SPSS使用该变量集，那么这个定义的用户变量集是不会自动发生作用的。也就是说用户应该告知SPSS系统要使用哪个变量集

运算，只能根据指定变量值作数值转换，且这种转换是单一数值的转换。图 2-31 “Recode into Different Variables”对话框图 2-32 “Recode into Different Variables：Old and New Values”对话框 2.4.6 变量的自动赋值（Automatic Recode）变量的自动赋值可以将字符型、数字型数值转变成连续的整数，并将结果保存在一个新的变量中，其中字符型数据按照字母的顺序排序。图 2-33 “Automatic Recode”对话框图 2-34 确定变量图 2-35 运行结果 2.4.7 变量定义信息的查询在 SPSS 数据编辑窗口中的“Variable View”标签中可以看到变量的定义信息，在其中还可以进行修改。在 SPSS 的“Utilities”菜单中还提供了变量信息的查询功能。图 2-36 “Variables”对话框 2.4.8 变量集的定义和使用在 SPSS 的统计过程中，有时候收集到的变量会有很多个。在进行各种数据处理和统计分析时，所有变量都会显示在各个处理对话框的变量列表框中供用户选择。在众多变量中选择几个变量进行处理以及分析是很麻烦的，尤其是对于某几个经常需要进行操作的变量。 SPSS 提供了变量集（Variable Set）的概念，可以很好地解决上面所提出的问题。 1．变量集的定义所谓变量集是指一些变量的集合。比如我们收集了某班级同学众多科目的成绩，可以把这些科目分为理科、文科、自然科学等，这其实就是变量集的概念。 SPSS 变量集有两类：系统变量集和用户自定义变量集。系统变量集是 SPSS 系统已经定义好的，它包括以下两个集合。 ALL VARIABLES：存放数据编辑窗口中所有的变量。 NEW VARIABLES：存放数据编辑窗口中所有尚未保存的新定义变量。用户自定义变量集是用户根据实际数据分析需要定义的，它可以有许多个。一般把需要经常处理的、处理过程类似的若干个变量存放在一个用户自定义变量集中。 2．定义用户变量集要将数学、物理、化学归到一个用户定义变量集中，名称为理科，具体操作的过程如下。图 2-37 “Define Variable Sets”对话框 3．用户变量集的使用如果仅仅定义用户变量集，而没有指定 SPSS 使用该变量集，那么这个定义的用户变量集是不会自动发生作用的。也就是说用户应该告知 SPSS 系统要使用哪个变量集

SPSS默认使用系统变量集，也就是说，SPSS默认在数据处理中，屏幕上列出数据文件所有的变量。如指定SPSS使用用户定义的变量集，那么在分析时，屏幕上就会只列出用户变量集中的那几个变量，从而简化了变量的选择过程。图2-38“Use Variable Sets”对话框图2-39列出用户变量集中变量 2.5数据文件的合并和分组统计分析的首要任务是将数据输入到计算机中。在数据量较大时，经常需要将一份大的数据文件分成几个小部分，分别由几个人输入，然后将若干个小的数据文件合并成一个大的数据文件。数据文件的合并有两种方式：纵向合并和横向合并。 2.5.1数据文件的纵向合并纵向合并就是将一个SPSS数据文件的内容追加到数据编辑窗口当前数据的后面，然后将合并后的数据重新显示在数据编辑窗口中。通过该方法，可以将两个或更多个数据文件合并在一起。图2-40数据文件纵向合并窗口图2-41纵向合并 2.5.2数据文件的横向合并横向连接，也就是变量值的合并。利用横向合并可以将两个或两个以上的具有相同个案的数据文件连在一起。即将SPSS数据文件的内容连接到当前数据编辑窗口的右边，然后将合并后的数据文件显示在数据编辑窗口中。横向合并实质是将两个数据文件，按照个案对应进行左右对接。实现数据文件的横向连接，必须有一个相同的公共变量，这个变量是两个数据文件横向对应连接的依据在合并的两个数据文件中，数据含义不同的变量，变量名不应取相同的名称图242数据文件横向合并窗口 2.5.3数据文件的分组(Split) 在统计中，经常需要先按某个变量进行分组，然后再求各个组的统计分析。例如，想分别了解男生和女生的成绩情况。这时就需要按照性别变量，进行数据文件的分组（这种分组是系统内定义的，在数据管理器中并不一定明确体现，故亦可称之为分割)。用户一旦设置了分组，那么此后的所有分析都将按这种分组进行，除非取消数据分组的命令。图2-43“Split File”(分组设置)对话框图2-44分组统计结果

SPSS 默认使用系统变量集，也就是说，SPSS 默认在数据处理中，屏幕上列出数据文件所有的变量。如指定 SPSS 使用用户定义的变量集，那么在分析时，屏幕上就会只列出用户变量集中的那几个变量，从而简化了变量的选择过程。图 2-38 “Use Variable Sets”对话框图 2-39 列出用户变量集中变量 2.5 数据文件的合并和分组统计分析的首要任务是将数据输入到计算机中。在数据量较大时，经常需要将一份大的数据文件分成几个小部分，分别由几个人输入，然后将若干个小的数据文件合并成一个大的数据文件。数据文件的合并有两种方式：纵向合并和横向合并。 2.5.1 数据文件的纵向合并纵向合并就是将一个 SPSS 数据文件的内容追加到数据编辑窗口当前数据的后面，然后将合并后的数据重新显示在数据编辑窗口中。通过该方法，可以将两个或更多个数据文件合并在一起。图 2-40 数据文件纵向合并窗口图 2-41 纵向合并 2.5.2 数据文件的横向合并横向连接，也就是变量值的合并。利用横向合并可以将两个或两个以上的具有相同个案的数据文件连在一起。即将 SPSS 数据文件的内容连接到当前数据编辑窗口的右边，然后将合并后的数据文件显示在数据编辑窗口中。横向合并实质是将两个数据文件，按照个案对应进行左右对接。实现数据文件的横向连接，必须有一个相同的公共变量，这个变量是两个数据文件横向对应连接的依据。在合并的两个数据文件中，数据含义不同的变量，变量名不应取相同的名称。图 2-42 数据文件横向合并窗口 2.5.3 数据文件的分组（Split）在统计中，经常需要先按某个变量进行分组，然后再求各个组的统计分析。例如，想分别了解男生和女生的成绩情况。这时就需要按照性别变量，进行数据文件的分组（这种分组是系统内定义的，在数据管理器中并不一定明确体现，故亦可称之为分割）。用户一旦设置了分组，那么此后的所有分析都将按这种分组进行，除非取消数据分组的命令。图 2-43 “Split File”（分组设置）对话框图 2-44 分组统计结果

2.6读入其他格式文件数据在前面的数据保存中，己经讲到SPSS数据文件可以保存成其他格式的文件，如文本文件、dbf文件等。反过来，SPSS是否可以直接读取其他格式数据文件呢？答案是肯定的。 SPSS可以读取文本文件、数据库文件等内容， 2.61读取固定格式的文本文件文本文件是计算机各种软件中最通用的一种格式文件。文本文件没有保存格式，因此其文件很小，其中的数据均以ASCⅢ码存储。各种软件，包括数据库软件、表格操作软件字处理软件都可以将自己的格式数据转换成文本文件。因此，如果SPSS能够方便读取文本文件，那么就提高了读取其他软件数据的能力。根据文本文件中数据的排列方式，可将文本文件分成固定格式的文本文件和自由格式的文本文件两种。固定格式(Fixed Columns)的文本文件，要求每个个案数据的变量数目、排列顺序、变量取值长度固定不变，一个个案数据可以占若干行，数据项之间可以有分隔符，也可以没有。分隔符一般为逗号、空格等。图2-45在菜单中选择“Read Text Data”命令图2-46“文本文件导入向导1”对话框（一）图2-47“文本文件导入向导2”对话框（一）图248“文本文件导入向导3”对话框（一）图2-49“文本文件导入向导4”对话框（一）图2-50“文本文件导入向导5”对话框（一）图2-51“文本文件导入向导6”对话框 2.62读取自由格式的文本文件自由格式的文本文件(FreeField)每个个案的变量数目、排列顺序固定，一个个案数据可以占据若干行，和固定格式文本文件不同的是，自由格式文本文件的数据项之间必须有分隔符（分隔符可以是逗号、空格、b键等），但数据项的长度可以变化。图2-52“文本文件导入向导1”对话框（二）图2-53“文本文件导入向导2”对话框（二）图2-54“文本文件导入向导3”对话框（二）图2-55“文本文件导入向导4”对话框（二）图2-56“文本文件导入向导5”对话框（二） 2.6.3读取dBASE软件文件(.dbf) dBASE数据库软件的文件以.df为扩展名保存。该文件除了保存纯数据信息外，还保存了一些数据结构、属性方面的信息。 SPSS提供了与DBASE文件的接口，可以方便地将dBASE文件读入数据编辑窗口

2.6 读入其他格式文件数据在前面的数据保存中，已经讲到 SPSS 数据文件可以保存成其他格式的文件，如文本文件、dbf 文件等。反过来，SPSS 是否可以直接读取其他格式数据文件呢？答案是肯定的。 SPSS 可以读取文本文件、数据库文件等内容。 2.6.1 读取固定格式的文本文件文本文件是计算机各种软件中最通用的一种格式文件。文本文件没有保存格式，因此，其文件很小，其中的数据均以 ASCII 码存储。各种软件，包括数据库软件、表格操作软件、字处理软件都可以将自己的格式数据转换成文本文件。因此，如果 SPSS 能够方便读取文本文件，那么就提高了读取其他软件数据的能力。根据文本文件中数据的排列方式，可将文本文件分成固定格式的文本文件和自由格式的文本文件两种。固定格式（Fixed Columns）的文本文件，要求每个个案数据的变量数目、排列顺序、变量取值长度固定不变，一个个案数据可以占若干行，数据项之间可以有分隔符，也可以没有。分隔符一般为逗号、空格等。图 2-45 在菜单中选择“Read Text Data”命令图 2-46 “文本文件导入向导 1”对话框（一）图 2-47 “文本文件导入向导 2”对话框（一）图 2-48 “文本文件导入向导 3”对话框（一）图 2-49 “文本文件导入向导 4”对话框（一）图 2-50 “文本文件导入向导 5”对话框（一）图 2-51 “文本文件导入向导 6”对话框 2.6.2 读取自由格式的文本文件自由格式的文本文件（Free Field）每个个案的变量数目、排列顺序固定，一个个案数据可以占据若干行，和固定格式文本文件不同的是，自由格式文本文件的数据项之间必须有分隔符（分隔符可以是逗号、空格、Tab 键等），但数据项的长度可以变化。图 2-52 “文本文件导入向导 1”对话框（二）图 2-53 “文本文件导入向导 2”对话框（二）图 2-54 “文本文件导入向导 3”对话框（二）图 2-55 “文本文件导入向导 4”对话框（二）图 2-56 “文本文件导入向导 5”对话框（二） 2.6.3 读取 dBASE 软件文件（.dbf） dBASE 数据库软件的文件以.dbf 为扩展名保存。该文件除了保存纯数据信息外，还保存了一些数据结构、属性方面的信息。 SPSS 提供了与 DBASE 文件的接口，可以方便地将 dBASE 文件读入数据编辑窗口

《教育科学研究方法》课程教学课件（访谈法）SPSS讲义02 第2章 变量、数据文件、系统参数

《教育科学研究方法》课程教学课件（访谈法）SPSS讲义02 第2章变量、数据文件、系统参数