第二章SPSS的数据管理 第一节数据的输入 2.1.1变量的定义 2.1.2数据格式化 2.1.3数据的输入 2.1.4缺失值处理 2.1.5变量标签 2.1.6数据管理器列宽定义 第二节数据的编辑 2.2.1数据的增删 2.2.2数据的整理 2.2.3数据的算术处理 第三节数据文件的管理 2.3.1数据文件的调用 2.3.2数据文件的连接 2.3.3数据文件的保存 统计分析离不开数据,因此数据管理是SPSS的重要组成部分。详细了解SPSS的数据 管理方法,将有助于用户提高工作效率。SPSS的数据管理是借助于数据管理窗口和主窗口 的File、Data、 Transform等菜单完成的 第一节数据的输入 2.1.1变量的定义 先激活数据管理窗口,然后选Data菜单的 Define variable.命令项,弹出 Define Variable对话框(见图1.1),在 Variable name:框内输入变量名,如本例为x1
第二章 SPSS 的数据管理 第一节 数据的输入 2.1.1 变量的定义 2.1.2 数据格式化 2.1.3 数据的输入 2.1.4 缺失值处理 2.1.5 变量标签 2.1.6 数据管理器列宽定义 第二节 数据的编辑 2.2.1 数据的增删 2.2.2 数据的整理 2.2.3 数据的算术处理 第三节 数据文件的管理 2.3.1 数据文件的调用 2.3.2 数据文件的连接 2.3.3 数据文件的保存 统计分析离不开数据,因此数据管理是 SPSS 的重要组成部分。详细了解 SPSS 的数据 管理方法,将有助于用户提高工作效率。SPSS 的数据管理是借助于数据管理窗口和主窗口 的 File、Data、Transform 等菜单完成的。 第一节 数据的输入 2.1.1 变量的定义 先激活数据管理窗口,然后选 Data 菜单的 Define Variable...命令项,弹出 Define Variable 对话框(见图 1.1),在 Variable Name:框内输入变量名,如本例为 x1
图1.1变量定义对话框 返回目录返回主页 2.1.2数据格式化 在 Define variable对话框中点击Type..钮,弹出 Define Variable Type对话框(如 图1.2所示),用户可根据具体资料的属性对数据进行格式化。 Define Variable Type对话 框中列出如下7种数据类型 图12定义变量类型对话框 Numeric:数值型,同时定义数值的宽度( Width),即整数部分+小数点+小数部分
图 1.1 变量定义对话框 2.1.2 数据格式化 在 Define Variable 对话框中点击 Type...钮,弹出 Define Variable Type 对话框(如 图 1.2 所示),用户可根据具体资料的属性对数据进行格式化。Define Variable Type 对话 框中列出如下 7 种数据类型: 图 1.2 定义变量类型对话框 1、Numeric:数值型,同时定义数值的宽度(Width),即整数部分+小数点+小数部分
的位数,默认为8位:定义小数位数( Decimal places),默认为2位。 2、 Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值 型 3、Dot:3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不 是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为12.345,00 (实际是12345E-4) 4、 Scientific notation:科学记数型,同时定义数值宽度( Width)和小数位数( Decimal Places),在数据管理窗口中以指数形式显示。如定义数值宽度为9,小数位数为2,则 345.678显示为3.46E+02。 5、Date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择 mm/d/yy形式,则1995年6月25日显示为06/25/95a 、 Dollar:货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数 值宽度和小数位数,显示形式为数值前有$ 7、 Custom currency:常用型,显示为整数部分每3位加一逗号,用户可定义数值宽 度和小数位数。如12345.678显示为12,345.678 8、 String:字符型,用户可定义字符长度( Characters)以便输入字符 用户选择完毕可点击 Continue钮返回 Define variable对话框 返回目录返回主页 2.1.3数据的输入 定义好变量并格式化数据之后,即可向数据管理窗口键入原始数据。数据管理窗口的 主要部分就是电子表格,横方向为电子表格的行,其行头以1、2、3、…表示,即第1、 2、3、…行;纵方向为电子表格的列,其列头以var001,var00002,var00003表示 变量名。行列交叉处称为单元格,即保存数据的空格。鼠标一旦移入电子表格内即呈十字 形,这时按鼠标左键可激活单元格,被激活的单元格以加粗的边框显示;用户也可以按方 向键上下左右移动来激活单元格。单元格被激活后,用户即可向其中输入新数据或修改已 有的数据。图1.3所示即为一个已输入数据的数据管理窗口。为方便起见,用户亦可省略 定义变量和数据格式化两个步骤,一启动SPSS即向数据管理窗口中键入原始数据,这时, 变量名默认为var0000l,var0002,var00003
的位数,默认为 8 位;定义小数位数(Decimal Places),默认为 2 位。 2、Comma:加显逗号的数值型,即整数部分每 3 位数加一逗号,其余定义方式同数值 型。 3、Dot:3 位加点数值型,无论数值大小,均以整数形式显示,每 3 位加一小点(但不 是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为 12.345,00 (实际是 12345E-4). 4、Scientific notation:科学记数型,同时定义数值宽度(Width)和小数位数(Decimal Places),在数据管理窗口中以指数形式显示。如 定义数值宽度为 9,小数位数为 2,则 345.678 显示为 3.46E+02。 5、Date:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择 mm/dd/yy 形式,则 1995 年 6 月 25 日显示为 06/25/95。 6、Dollar:货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数 值宽度和小数位数,显示形式为数值前有$。 7、Custom currency:常用型,显示为整数部分每 3 位加一逗号,用户可定义数值宽 度和小数位数。如 12345.678 显示为 12,345.678。 8、String:字符型,用户可定义字符长度(Characters)以便输入字符。 用户选择完毕可点击 Continue 钮返回 Define Variable 对话框。 2.1.3 数据的输入 定义好变量并格式化数据之后,即可向数据管理窗口键入原始数据。数据管理窗口的 主要部分就是电子表格,横方向为电子表格的行,其行头以 1、2、3、……表示,即第 1、 2、3、……行;纵方向为电子表格的列,其列头以 var00001,var00002,var00003……表示 变量名。行列交叉处称为单元格,即保存数据的空格。鼠标一旦移入电子表格内即呈十字 形,这时按鼠标左键可激活单元格,被激活的单元格以加粗的边框显示;用户也可以按方 向键上下左右移动来激活单元格。单元格被激活后,用户即可向其中输入新数据或修改已 有的数据。图 1.3 所示即为一个已输入数据的数据管理窗口。为方便起见,用户亦可省略 定义变量和数据格式化两个步骤,一启动 SPSS 即向数据管理窗口中键入原始数据,这时, 变量名默认为 var00001,var00002,var00003……
图1.3数据管理器 返回目录返回主页 2.1.4缺失值处理 在实际工作中,因各种原因会出现数值缺失现象,为此,SPSS提供缺失值处理技术。 在 Define variable对话框中点击 Missing value.钮,弹出 Define Missing values对 话框(图1.4),用户有4个可选项
图 1.3 数据管理器 2.1.4 缺失值处理 在实际工作中,因各种原因会出现数值缺失现象,为此,SPSS 提供缺失值处理技术。 在 Define Variable 对话框中点击 Missing Value...钮,弹出 Define Missing Values 对 话框(图 1.4),用户有 4 个可选项:
图1.4缺失值定义对话框 1、 No missing values:没有缺失值 2、 Discrete missing values:可定义1-3个。如测量身高(厘米)的资料,可定义 999为缺失值:性别的资料(男为1、女为2),可定义-1为缺失值 3、 Range of missing values:可定义缺失值的范围。如脉搏资料,可定义0-9为缺 失值 4、 Range plus one discrete missing value:可定义缺失值的范围,同时定义另外1 个不是这一范围的缺失值。如定义0-9为脉搏的缺失值,同时定义999为身高的缺失值 返回目录返回主页 2.1.5变量标签 在 Define variable对话框中点击 Labels..钮,弹出 Define labels对话框(图1.5), 用户可定义变量标签和特定变量值的标签。如定义变量hb的标签为“血红蛋白值”,同时定 义12.36为“正常”,则可在 Define labels对话框中的 Variable label处输入变量标签名, 在 Value labels框中的 Value处指定变量值,在 Value label处输入变量值标签,点击 Add钮表示加入这种标签定义,点击 Change表示更改原有标签,用户重新定义,点击 Remove 钮表示取消原有标签
图 1.4 缺失值定义对话框 1、No missing values:没有缺失值; 2、Discrete missing values:可定义 1-3 个。如测量身高(厘米)的资料,可定义 999 为缺失值;性别的资料(男为 1、女为 2),可定义-1 为缺失值; 3、Range of missing values:可定义缺失值的范围。如脉搏资料,可定义 0—9 为缺 失值; 4、Range plus one discrete missing value:可定义缺失值的范围,同时定义另外 1 个不是这一范围的缺失值。如定义 0—9 为脉搏的缺失值,同时定义 999 为身高的缺失值。 2.1.5 变量标签 在 Define Variable 对话框中点击 Labels...钮,弹出 Define Labels 对话框(图 1.5), 用户可定义变量标签和特定变量值的标签。如定义变量 hb 的标签为“血红蛋白值”,同时定 义 12.36 为“正常”,则可在 Define Labels 对话框中的 Variable Label 处输入变量标签名, 在 Value Labels 框中的 Value 处指定变量值,在 Value Label 处输入变量值标签,点击 Add 钮表示加入这种标签定义,点击 Change 表示更改原有标签,用户重新定义,点击 Remove 钮表示取消原有标签
图1.5定义标签对话框 返回目录返回主页 2.1.6数据管理器列宽定义 在 Define variable对话框中点击 Column format...钮,弹出 Define column format 对话框(图1.6),用户可定义数据管理器纵列的宽度,以便显示较长的数值或文字;同时 用户还可指定数值或文字在数据管理器单元格中的位置:Left表示靠左、 Center表示居中、 Right表示靠右(此为默认方式)。 图1.6列宽格式定义对话框 返回目录返回主页
图 1.5 定义标签对话框 2.1.6 数据管理器列宽定义 在 Define Variable 对话框中点击 Column Format...钮,弹出 Define Column Format 对话框(图 1.6),用户可定义数据管理器纵列的宽度,以便显示较长的数值或文字;同时 用户还可指定数值或文字在数据管理器单元格中的位置:Left 表示靠左、Center 表示居中、 Right 表示靠右(此为默认方式)。 图 1.6 列宽格式定义对话框
第二节数据的编辑 输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为 此,系统提供了如下主要方法。 2.2.1数据的增删 2.2.1.1增加一个新的变量列 例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则可先激活第 列的任一单元格,然后选Data菜单的 Insert Variable命令项,系统自动为用户在第2列 前插入一个新的变量列,原第2列自动向右移一列成为第3列。 2.2.1.2增加一个新的观察单位(即增加一个新的行) 例如要在第6个观察单位前增加一个观察单位(亦即在第6行前增加一行,使原来的 第6行下移成为第7行),则可先激活第6行的任一单元格,然后选Data菜单的 Insert case 命令项,系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7 行 2.2.1.3增加一个新的观察值 例如由于输入错误,造成第7个观察单位的第4个变量值漏输,结果第8个观察单位 的第4个变量值误为第7个观察单位的第4个变量值,这样的情形使得数据管理器中的第4 个变量值从第7行起全部上移,而合计例数少一个。于是希望在第7行的第4列处插入1 个单元格,原有数据依次下移恢复正常。可先将鼠标指向在第η行第4列交叉处的单元格, 然后按住鼠标左键向下拖动鼠标直至第4列从第7行起的所有数据被选中(黑底白字),选 Edit菜单的Cut命令项,选中的数据被剪切入剪贴板,再激活第8行第4列交叉处的单元 格,选Edit菜单的 Paste命令项,可将剪贴板中的原第7行起的所有数据下移自第δ行开 始,并空出第7行第4列的单元格以便补入漏输的数值。 2.2.1.4删除一个行 例如要删除第9行(即删除这个观察单位的所有观察值),则可先点击第9行的行头 这时整个第9行被选中(呈黑底白字状),然后按 Delete键或选Edit菜单的 Clear命令项 该行即被删除。 2.2.1.5删除一个变量列 例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中(呈黑 底白字状),然后按 Delete键或选Edit菜单的 Clear命令项,该列即被删除, 2.2.1.6删除一个观察值 例如由于输入错误,造成第6个观察单位的第2个变量值重复输入,结果第7个观察 单位的第2个变量值误为第6个观察单位的第2个变量值,第8个观察单位的第2个变量 值误为第7个观察单位的第2个变量值,……,这样的情形使得数据管理器中的第2个变
第二节 数据的编辑 输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为 此,系统提供了如下主要方法。 2.2.1 数据的增删 2.2.1.1 增加一个新的变量列 例如要在第 2 列前增加一个新的列,使原来的第 2 列右移变成第 3 列,则可先激活第 2 列的任一单元格,然后选 Data 菜单的 Insert Variable 命令项,系统自动为用户在第 2 列 前插入一个新的变量列,原第 2 列自动向右移一列成为第 3 列。 2.2.1.2 增加一个新的观察单位(即增加一个新的行) 例如要在第 6 个观察单位前增加一个观察单位(亦即在第 6 行前增加一行,使原来的 第 6 行下移成为第 7 行),则可先激活第 6 行的任一单元格,然后选 Data 菜单的 Insert Case 命令项,系统自动为用户在第 6 行前插入一个新的行,原第 6 行列自动向下移一行成为第 7 行。 2.2.1.3 增加一个新的观察值 例如由于输入错误,造成第 7 个观察单位的第 4 个变量值漏输,结果第 8 个观察单位 的第 4 个变量值误为第 7 个观察单位的第 4 个变量值,这样的情形使得数据管理器中的第 4 个变量值从第 7 行起全部上移,而合计例数少一个。于是希望在第 7 行的第 4 列处插入 1 个单元格,原有数据依次下移恢复正常。可先将鼠标指向在第 7 行第 4 列交叉处的单元格, 然后按住鼠标左键向下拖动鼠标直至第 4 列从第 7 行起的所有数据被选中(黑底白字),选 Edit 菜单的 Cut 命令项,选中的数据被剪切入剪贴板,再激活第 8 行第 4 列交叉处的单元 格,选 Edit 菜单的 Paste 命令项,可将剪贴板中的原第 7 行起的所有数据下移自第 8 行开 始,并空出第 7 行第 4 列的单元格以便补入漏输的数值。 2.2.1.4 删除一个行 例如要删除第 9 行(即删除这个观察单位的所有观察值),则可先点击第 9 行的行头, 这时整个第 9 行被选中(呈黑底白字状),然后按 Delete 键或选 Edit 菜单的 Clear 命令项, 该行即被删除。 2.2.1.5 删除一个变量列 例如要删除第 4 个变量列,则可先点击第 4 列的列头,这时整个第 4 列被选中(呈黑 底白字状),然后按 Delete 键或选 Edit 菜单的 Clear 命令项,该列即被删除。 2.2.1.6 删除一个观察值 例如由于输入错误,造成第 6 个观察单位的第 2 个变量值重复输入,结果第 7 个观察 单位的第 2 个变量值误为第 6 个观察单位的第 2 个变量值,第 8 个观察单位的第 2 个变量 值误为第 7 个观察单位的第 2 个变量值,……,这样的情形使得数据管理器中的第 2 个变
量值从第7行起全部下移,而合计例数多一个。于是希望将第7行第2列的单元格删除 原有数据依次上移恢复正常。可先将鼠标指向在第8行第2列交叉处的单元格,然后按住 鼠标左键向下拖动鼠标直至第2列从第8行起的所有数据被选中(黑底白字),选Edit菜 单的Cut命令项,选中的数据被剪切入剪贴板,再激活第7行第2列交叉处的单元格,按 Del键删除该单元格的数值,选Edit菜单的 Paste命令项,可将剪贴板中的原第8行起的 所有数据上移自第7行开始,既填补第7行第2列的单元格,又恢复原有下移的数值 返回目录返回主页 2.2.2数据的整理 2.2.2.1数据的排序 用户可按要求对数据管理器的数据进行排序。选≯钮使之进入 Sort by框,然后在Sort 0rder框中确定是按升序( Ascending,从小到大)或降序( Descending,从大到小),点击 0K钮即可。 图1.7排序对话框 2.2.2.2数据的行列互换 有时,用户需要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方 向排列的数据,这时可选Data菜单的 Transpose.命令项,弹出 Transpose...对话框(图 1.8),在变量名列框中选1个或多个需要转换的变量,点击>钮使之进入 Variable(s)框 再点击0K钮即可。产生的新数据会在第1列出现一个 case lb1新变量,用于放置原来数 值的变量名。若要将数据再转换回原来的排列方式,方法与上述过程相同
量值从第 7 行起全部下移,而合计例数多一个。于是希望将第 7 行第 2 列的单元格删除, 原有数据依次上移恢复正常。可先将鼠标指向在第 8 行第 2 列交叉处的单元格,然后按住 鼠标左键向下拖动鼠标直至第 2 列从第 8 行起的所有数据被选中(黑底白字),选 Edit 菜 单的 Cut 命令项,选中的数据被剪切入剪贴板,再激活第 7 行第 2 列交叉处的单元格,按 Del 键删除该单元格的数值,选 Edit 菜单的 Paste 命令项,可将剪贴板中的原第 8 行起的 所有数据上移自第 7 行开始,既填补第 7 行第 2 列的单元格,又恢复原有下移的数值。 2.2.2 数据的整理 2.2.2.1 数据的排序 用户可按要求对数据管理器的数据进行排序。选 ➢ 钮使之进入 Sort by 框,然后在 Sort Order 框中确定是按升序(Ascending,从小到大)或降序(Descending,从大到小),点击 OK 钮即可。 图 1.7 排序对话框 2.2.2.2 数据的行列互换 有时,用户需要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方 向排列的数据,这时可选 Data 菜单的 Transpose...命令项,弹出 Transpose...对话框(图 1.8),在变量名列框中选 1 个或多个需要转换的变量,点击 ➢ 钮使之进入 Variable(s)框, 再点击 OK 钮即可。产生的新数据会在第 1 列出现一个 case_lbl 新变量,用于放置原来数 值的变量名。若要将数据再转换回原来的排列方式,方法与上述过程相同
图1.8行列互换框 2.2.2.3数据的分组汇总 用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十 分多样。例如,要对下列数据(图1.9)按变量 group的大小,把变量x1作平均值汇总、 把变量x2作求和汇总。选Data菜单的 Aggregate.命令项,弹出 Aggregate Data对话框 (图1.10),在变量名列框中选 group变量,点击》钮使之进入 Break variable(s)框 选x1变量进入 Aggregate variable(s)框,因x1欲作平均值汇总,故点击 Function...钮 弹出 Aggregate Data: Aggregate Function对话框(图1.11)选 Mean of values项点击 Continue钮返回;选x2变量进入 Aggregate Variable(s)框,因x2变量欲作求和汇总, 故点击 Function...钮选 Sum of values项点击 Continue钮返回。再点击CK钮即可。结果 如图1.12所示 图1.9欲作分组汇总的原始数据
图 1.8 行列互换框 2.2.2.3 数据的分组汇总 用户还可对数据管理器中的数据按指定变量的数值进行归类分组汇总,汇总的形式十 分多样。例如,要对下列数据(图 1.9)按变量 group 的大小,把变量 x1 作平均值汇总、 把变量 x2 作求和汇总。选 Data 菜单的 Aggregate...命令项,弹出 Aggregate Data 对话框 (图 1.10),在变量名列框中选 group 变量,点击 ➢ 钮使之进入 Break Variable(s)框, 选 x1 变量进入 Aggregate Variable(s)框,因 x1 欲作平均值汇总,故点击 Function...钮 弹出 Aggregate Data: Aggregate Function 对话框(图 1.11)选 Mean of values 项点击 Continue 钮返回;选 x2 变量进入 Aggregate Variable(s)框,因 x2 变量欲作求和汇总, 故点击 Function...钮选 Sum of values 项点击 Continue 钮返回。再点击 OK 钮即可。结果 如图 1.12 所示。 图 1.9 欲作分组汇总的原始数据
图1.10分组汇总对话框 图1.11分组汇总的函数功能对话框
图 1.10 分组汇总对话框 图 1.11 分组汇总的函数功能对话框