第二章数据文件的管理(下) (医学统计之星:张文彤) 2.2.1.2从原有变量计算新变量 从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立, 需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新 变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要 了解一下所用的对话框界面的情况 【SPSS对话框元素介绍】 下面是我们在第一章曾经见过的两样本t检验对话框: [ Independent-Samples T Test Test Variable(s) Reset Cancel Hel muping Variable Define Grot Options… 这是一个非常典型的SPSS对话框。它包含了许多具有SPSS特色的对话框元 素 。对话框左侧为候选变量列表框,里面列出了可被该对话框使用的变 右上方为 Test variables框,可将变量选入其中;注意在两个框的 中间用 ”相连,这是变量移动按钮,其方向表明是将变量从那个框 移动到哪个框,上图中我们选中了变量 group,两个移动按钮均变黑并向 右指,表明变量 group可以移动到他们右侧的两个框里去,改变当前框(在 其他两个框里单击),移动按钮就会转向、变灰等以表明不同的意思(墙 头草一个,可别小看这个功能,我想用VB实现这个功能,也是费了些工 夫才把它搞定了);
第二章 数据文件的管理(下) (医学统计之星:张文彤) 2.2.1.2 从原有变量计算新变量 从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立, 需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新 变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要 了解一下所用的对话框界面的情况。 【SPSS 对话框元素介绍】 下面是我们在第一章曾经见过的两样本 t 检验对话框: 这是一个非常典型的 SPSS 对话框。它包含了许多具有 SPSS 特色的对话框元 素: o 对话框左侧为候选变量列表框,里面列出了可被该对话框使用的变 量; o 右上方为 Test Variables 框,可将变量选入其中;注意在两个框的 中间用“ ”相连,这是变量移动按钮,其方向表明是将变量从那个框 移动到哪个框,上图中我们选中了变量 group,两个移动按钮均变黑并向 右指,表明变量 group 可以移动到他们右侧的两个框里去,改变当前框(在 其他两个框里单击),移动按钮就会转向、变灰等以表明不同的意思(墙 头草一个,可别小看这个功能,我想用 VB 实现这个功能,也是费了些工 夫才把它搞定了);
。右侧为一排五个按钮,分别是确定、粘贴、重置、取消和帮助。这 五个兄弟也是几乎永远一起出现的,另外四个大家都比较熟悉了,重置 ( Reset)按钮用于取消对话框内已做的选择,恢复到默认的状态; 。最下方有个 Options按钮,用于设置专门用于该对话框的选项 OK、 Paste两个按钮为灰色,表明所需条件尚未满足,该按钮暂不可 用。同理, Grouping variable框下方的 Define groups按钮为灰色显示, 也表明暂不可用 【 Compute Variable对话框】 例3.2在1i1l1.sav中建立新变量temp,令其值当血磷值大于1时为2, 否则为1。 解:这里需要用到 Compute Variable对话框,外加一点技巧。首先给变量 temp均赋值为1,然后将血磷值大于1的记录其tem变量值改为2即可。选择 菜单 Transform==> Compute,弹出 Compute Variable对话框如下: 区 Target Variable Numeric Expression: Type&Label 分组变量 groupl 缈血磷值冈 S9cndn:□ 1 23 ANYtestvalue, value. 3 ARSIN(numexpr ARTAN(numexpr Delete CDFNORM(zvalue CDF BERNOULLI[ p] If OK Paste Reset Cancel Help 左上角为需要计算的变量名,在其中键入“temp”,此时“Type& Lable”按 钮就会变黑,喜欢精确的朋友可以在这里对tem进行详细的定义,但如果你和 我一样非常懒,就可以对它视而不见(不要生气,聪明人大多都非常懒:));左 下方为候选变量列表,现在还用不着:中部为类似计算器的软键盘,可以用鼠标 按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的 数值表达式窗口中出现:软键盘右侧为函数窗口,可以在这里找到并使用所需的 SPSS函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会 自动生成一个新变量temp,并且取值均为1
o 右侧为一排五个按钮,分别是确定、粘贴、重置、取消和帮助。这 五个兄弟也是几乎永远一起出现的,另外四个大家都比较熟悉了,重置 (Reset)按钮用于取消对话框内已做的选择,恢复到默认的状态; o 最下方有个 Options 按钮,用于设置专门用于该对话框的选项; o OK、Paste 两个按钮为灰色,表明所需条件尚未满足,该按钮暂不可 用。同理,Grouping Variable 框下方的 Define Groups 按钮为灰色显示, 也表明暂不可用。 【Compute Variable 对话框】 例 3.2 在 li1_1.sav 中建立新变量 temp,令其值当血磷值大于 1 时为 2, 否则为 1。 解:这里需要用到 Compute Variable 对话框,外加一点技巧。首先给变量 temp 均赋值为 1,然后将血磷值大于 1 的记录其 temp 变量值改为 2 即可。选择 菜单 Transform==>Compute,弹出 Compute Variable 对话框如下: 左上角为需要计算的变量名,在其中键入“temp”,此时“Type&Lable”按 钮就会变黑,喜欢精确的朋友可以在这里对 temp 进行详细的定义,但如果你和 我一样非常懒,就可以对它视而不见(不要生气,聪明人大多都非常懒:));左 下方为候选变量列表,现在还用不着;中部为类似计算器的软键盘,可以用鼠标 按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的 数值表达式窗口中出现;软键盘右侧为函数窗口,可以在这里找到并使用所需的 SPSS 函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会 自动生成一个新变量 temp,并且取值均为 1
软键盘上几个奇奇怪怪的符号的含义如下: 不等号,等价于逻辑符号逻辑符号乘方,相当于函数逻辑符号 AND EXPO NOT 在函数窗口中选中某个函数并单击右键,系统就会弹出该函数的用法说明。 函数主要是和变量名组合起来使用的,比如说ABS(x)就是取变量x的绝对 好,现在开始进行第二步,再次选择菜单 Transform=> Compute,系统也再 次弹出这个对话框一一等等!注意到了吗?该对话框自动记住了你上次输入的内 容,几乎所有SPSS的对话框都有这个特性,这会大大方便我们的使用。好,将 数值表达式窗口中的1改为2,然后单击中下部的“If”按钮,系统弹出记录选 择对话框如下: Compute Variable: If Cases 分组变量 Igroup F Include all cases 吵血磷值冈 C Include if case satisfies condition temp 9 Functions: ARSIN() ARTAN(numexpr) CDFNORM(zvalue Delete cDF BERNOULLI(qpl Continue Cancel Help 不需要太多解释,大部分内容都是前面见过的。由于我们这里不是对所有记 录做变换,因此选中第二个单选钮“ Include if case statisfies confition:” 此时下方的所有窗口变亮,表明现在可用:而“ Continue”按钮变灰,表明当前 还没有提供所需的信息,好,我们就来提供,在左侧选中血磷值(x),然后单击 x就被引入了右侧的变量框,任你用键盘或者用鼠标,总之将下面这
软键盘上几个奇奇怪怪的符号的含义如下: ~= & | ** ~ 不等号,等价于 <> 逻辑符号 AND 逻辑符号 OR 乘方,相当于函数 EXP() 逻辑符号 NOT 在函数窗口中选中某个函数并单击右键,系统就会弹出该函数的用法说明。 函数主要是和变量名组合起来使用的,比如说 ABS(x)就是取变量 x 的绝对 值。 好,现在开始进行第二步,再次选择菜单 Transform==>Compute,系统也再 次弹出这个对话框--等等!注意到了吗?该对话框自动记住了你上次输入的内 容,几乎所有 SPSS 的对话框都有这个特性,这会大大方便我们的使用。好,将 数值表达式窗口中的 1 改为 2,然后单击中下部的“If”按钮,系统弹出记录选 择对话框如下: 不需要太多解释,大部分内容都是前面见过的。由于我们这里不是对所有记 录做变换,因此选中第二个单选钮“Include if case statisfies confition:”, 此时下方的所有窗口变亮,表明现在可用;而“Continue”按钮变灰,表明当前 还没有提供所需的信息,好,我们就来提供,在左侧选中血磷值(x),然后单击 “ ”,x 就被引入了右侧的变量框,任你用键盘或者用鼠标,总之将下面这
个算式补充完:x1。现在可见“ Continue”按钮再度变黑。在它又变灰之前赶 快单击它(开个玩笑),系统回到 Compute Variable对话框,请注意If按钮右 侧的变化:x>2。如果你做的结果不一样,请重来一遍。 现在单击“OK”按钮,由于我们要替换变量值,系统会弹出一个确认对话框 确认替换,马上你就会看到,我们已经把这道题做完了。 【 Count对话框】 Count对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象 有点拗口),比如我们想看看有哪些记录的血磷值在2~3之间,选择菜单 Transform==> Count,系统弹出 Count对话框如下: L': Count Occurrences of Values within Cases Target Variable Target Label: OK 分组变量[grou Variables: Paste 缈血磷值冈 Reset temp Cancel Help Define values Target Variable框中用于指定记录变量值是否出现的变量名,在这里输入 emp2;选中血磷值(x),将其选入 Variables窗口,此时“ Define values”按 钮变黑,单击它,系统弹出变量值定义窗口如下
个算式补充完:x>1。现在可见“Continue”按钮再度变黑。在它又变灰之前赶 快单击它(开个玩笑),系统回到 Compute Variable 对话框,请注意 If 按钮右 侧的变化:x>2。如果你做的结果不一样,请重来一遍。 现在单击“OK”按钮,由于我们要替换变量值,系统会弹出一个确认对话框, 确认替换,马上你就会看到,我们已经把这道题做完了。 【Count 对话框】 Count 对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象 有点拗口),比如我们想看看有哪些记录的血磷值在 2~3 之间,选择菜单 Transform==>Count,系统弹出 Count 对话框如下: Target Variable 框中用于指定记录变量值是否出现的变量名,在这里输入 temp2;选中血磷值(x),将其选入 Variables 窗口,此时“Define Values”按 钮变黑,单击它,系统弹出变量值定义窗口如下:
Count Values within Cases: Values to Count Value Values to Count: o value. C System-missing C System- or user-missing Change C Ra Remove through C Range Lowest through C Range through highest Continue Cancel Help 左半部为变量值定义窗口,可以定义某个值、系统缺失值、系统或用户定义 缺失值、变量值范围、小于某值或大于某值。我们这里是第四种情况:选择 Range, 在 through两侧分别键入2、3,然后单击已变黑的“Add”按钮,“2thru3 就会被加入“ Values to count”框内。然后单击“ Continue”,再单击 Count 对话框的“OK”,可以看到系统自动生成变量temp2,其中10、11号记录因血 磷值介于2和3之间,temp2取值为1,其余的记录temp2取值均为0。 s0s,Ss0s,请大家千万注意, Count对话框有一个潜在的bugs,当你需要计 算同时满足两个变量取值条件的记录数有多少时,直接用该对话框会得出完全错 误的结果。这里有一点技巧,需要对对话框生成的指令加以修改,至于怎么修改 嘛,我们将在 Syntax(语法)窗口使用详解一章中讲述:)。 【 Recode对话框】 Recode对话框用于从原变量值按照某种一一对应的关系生成新变量值,可 以将新值赋给原变量,也可以生成一个新变量。 例2.3在Li11.sav中生成新变量temp3,当血磷值小于1时取值为0 1~2时取值为10,大于2时取值为20。 解:选择菜单 Transform=> Record==> Into different Variables, Recode 对话框如下:
左半部为变量值定义窗口,可以定义某个值、系统缺失值、系统或用户定义 缺失值、变量值范围、小于某值或大于某值。我们这里是第四种情况:选择 Range, 在 through 两侧分别键入 2、3,然后单击已变黑的“Add”按钮,“2 thru 3” 就会被加入“Values to Count”框内。然后单击“Continue”,再单击 Count 对话框的“OK”,可以看到系统自动生成变量 temp2,其中 10、11 号记录因血 磷值介于 2 和 3 之间,temp2 取值为 1,其余的记录 temp2 取值均为 0。 SOS,SOS,请大家千万注意,Count 对话框有一个潜在的 bugs,当你需要计 算同时满足两个变量取值条件的记录数有多少时,直接用该对话框会得出完全错 误的结果。这里有一点技巧,需要对对话框生成的指令加以修改,至于怎么修改 嘛,我们将在 Syntax(语法)窗口使用详解一章中讲述 :)。 【Recode 对话框】 Recode 对话框用于从原变量值按照某种一一对应的关系生成新变量值,可 以将新值赋给原变量,也可以生成一个新变量。 例 2.3 在 Li1_1.sav 中生成新变量 temp3,当血磷值小于 1 时取值为 0, 1~2 时取值为 10,大于 2 时取值为 20。 解:选择菜单 Transform==>Record==>Into Different Variables,Recode 对话框如下:
. Recode into Different Variables 分组变量grou Input Variable ->Output Variable OutputVariable 秒血磷值k #te temp2 If Old and New values Paste Reset Cancel Help 将血磷值(x)选入 Input Variable-> Output Variable框,此时 Output Variable框变黑,在其中键入新变量名temp3并单击 Change,可见原来的x->? 变成了x-temp3。现在单击“0 ld and New values”,系统弹出变量值定义对 话框如下: Recode into Different Variables: 0ld and New values Old value New value C Value C Value C System-missing System-missing C Copy old value(s) C System- or user-missing Old->New. c Rant Add through□ Change C Range: Lowest through Remove C Range: Output variables are strings width through highest r Convert numeric strings to numbers [575 C All other values Continue Cancel Help 许多东西和前面类似,不再重复。按照题目的要求,选择 Range: Lowest through,在右侧框中键入1,然后在右上方的 Value右侧框中键入对应的新变 量值0,此时下方Add键变黑,单击它,Old->New框中就会加入 Lowest thru1->0, 按照类似的方法依次加入另两条转换规则,最终0ld->New框中共有 Lowest thru 1->0、1thru2->10、Else->20三条,现在单击 Continue,再单击OK,系统就 会按要求生成新变量temp3
将血磷值(x)选入 Input Variable->Output Variable 框,此时 Output Variable 框变黑,在其中键入新变量名 temp3 并单击 Change,可见原来的 x->? 变成了 x->temp3。现在单击“Old and New Values”,系统弹出变量值定义对 话框如下: 许多东西和前面类似,不再重复。按照题目的要求,选择 Range:Lowest through,在右侧框中键入 1,然后在右上方的 Value 右侧框中键入对应的新变 量值 0,此时下方 Add 键变黑,单击它,Old->New 框中就会加入 Lowest thru 1->0, 按照类似的方法依次加入另两条转换规则,最终 Old->New 框中共有 Lowest thru 1->0、1 thru 2->10、Else->20 三条,现在单击 Continue,再单击 OK,系统就 会按要求生成新变量 temp3
哎呀不得了,图片太多了,虽然这样非常直观,但下载速度太慢了。等大家 对基本界面操作熟悉了后,我们将对比较简单的对话框试着对操作用文字的方式 描述,比如上面的操作我们将用文字表达为: 1. Output Variable框:选入x 2. Output Variable Name框:键入temp3:单击 Change钮 3.选中x->temp3:单击 old and New Values钮 4. Range: Lowest through单选钮:键入1: New valuevalue单选 钮:键入0:单击Add钮 5. Range: through单选钮:两侧分别键入1、2: New valuevalue 单选钮:键入10:单击Add钮 6. Range: All other values单选钮: New value value单选钮 键入20:单击Add钮 7 单击 Continue 8.单击OK 怎么样,还能理解吧。 【 Categorize Variables对话框】 Categorize Variables对话框用于将连续性变量自动按要求分成等间距的 几类。其界面非常简单,许多东西都是我们所熟悉的,唯一特别的是右下方的 number of categories框,用于输入变量的等级数,默认为4,比如我们希望将 血磷值按大小分成5个等级,先将血磷值选入 Create Categories框,然后将下 面的4改为5,单击郇K,就会看到系统产生了一个新变量nx(即 number of x 之意),其取值就对应了血磷值相应的5个等级(1~5)。重复一下,具体操作 步骤为 1. Create Categories框:选入x 2. Number of categories HE: 5 【 Rank cases对话框】 例2.4请分组计算血磷值的秩和。 解:选择菜单 Transform=> Rank cases,弹出 Rank cases对话框如下:
哎呀不得了,图片太多了,虽然这样非常直观,但下载速度太慢了。等大家 对基本界面操作熟悉了后,我们将对比较简单的对话框试着对操作用文字的方式 描述,比如上面的操作我们将用文字表达为: 1. Output Variable 框:选入 x 2. Output Variable Name 框:键入 temp3:单击 Change 钮 3. 选中 x->temp3:单击 Old and New Values 钮: 4. Range:Lowest through 单选钮:键入 1:New Value Value 单选 钮:键入 0:单击 Add 钮 5. Range: through 单选钮:两侧分别键入 1、2:New Value Value 单选钮:键入 10:单击 Add 钮 6. Range: All other values 单选钮:New Value Value 单选钮: 键入 20:单击 Add 钮 7. 单击 Continue 8. 单击 OK 怎么样,还能理解吧。 【Categorize Variables 对话框】 Categorize Variables 对话框用于将连续性变量自动按要求分成等间距的 几类。其界面非常简单,许多东西都是我们所熟悉的,唯一特别的是右下方的 number of categories 框,用于输入变量的等级数,默认为 4,比如我们希望将 血磷值按大小分成 5 个等级,先将血磷值选入 Create Categories 框,然后将下 面的 4 改为 5,单击 OK,就会看到系统产生了一个新变量 nx(即 number of x 之意),其取值就对应了血磷值相应的 5 个等级(1~5)。重复一下,具体操作 步骤为: 1. Create Categories 框:选入 x 2. Number of categories 框:5 3. OK 【Rank Cases 对话框】 例 2.4 请分组计算血磷值的秩和。 解:选择菜单 Transform==>Rank Cases,弹出 Rank Cases 对话框如下:
Rank Case 分组变量四owp Variable(s) OK 秒>血磷值 Paste Reset Cance By Help Assign Rank 1 to c Smallest value v Display summary tables C Largest value Re ank Types. Ties. 将血磷值选入 Variable框,分组变量选入By框,单击OK即可。系统会建 立一个新变量rx(即原变量名前加r表示Rank之意),其取值为x分组的秩次 D解释一下 Rank cases对话框的其他几个零件: 左下角的 Assign Rank l to框架用于选择将秩次1赋给最小值还是 最大值 中下部的 Display summary tables复选框用于确定是否在结果窗口 内输出结果报表 Rank Types钮用于定义秩次类型,有Rank(秩分数)、 Savage评分 (新变量值按指数分布)、 Fractional rank(新变量值是秩分数除以非 缺失值观测量的权重之和)、 Fractional rank%(新变量值是秩分数除 以非缺失值观测量数乘100)、 Sum of case weights(新变量值是各观 测量的权重之和)、 Ntiles(新变量值是按所选变量的百分位数分组的组 序号),默认值为Rank。单击More按钮,还会有更多的设置,这里就不 再讲了 Ties钮用于定义对相同值观测量的处理方式,可以是取平均秩次、 最小值、最大值或当作一个记录处理,默认值为取平均秩次。 【 Automatic record对话框】 该对话框用于按原变量值的大小生成新变量,变量值就是原值的大小次序 功能和 Rank cases对话框重复(等价于相同值观测量当作一个记录处理的情况)。 【 Create Time Series对话框】 用于自动生成时间序列变量,由于太专业,这里不做过多解释
将血磷值选入 Variable 框,分组变量选入 By 框,单击 OK 即可。系统会建 立一个新变量 rx(即原变量名前加 r 表示 Rank 之意),其取值为 x 分组的秩次。 解释一下 Rank Cases 对话框的其他几个零件: o 左下角的 Assign Rank 1 to 框架用于选择将秩次 1 赋给最小值还是 最大值; o 中下部的 Display summary tables 复选框用于确定是否在结果窗口 内输出结果报表; o Rank Types 钮用于定义秩次类型,有 Rank(秩分数)、Savage 评分 (新变量值按指数分布)、Fractional rank(新变量值是秩分数除以非 缺失值观测量的权重之和)、Fractional rank %(新变量值是秩分数除 以非缺失值观测量数乘 100)、Sum of case weights(新变量值是各观 测量的权重之和)、Ntiles(新变量值是按所选变量的百分位数分组的组 序号),默认值为 Rank。单击 More 按钮,还会有更多的设置,这里就不 再讲了。 o Ties 钮用于定义对相同值观测量的处理方式,可以是取平均秩次、 最小值、最大值或当作一个记录处理,默认值为取平均秩次。 【Automatic Record 对话框】 该对话框用于按原变量值的大小生成新变量,变量值就是原值的大小次序, 功能和 Rank Cases 对话框重复(等价于相同值观测量当作一个记录处理的情况)。 【Create Time Series 对话框】 用于自动生成时间序列变量,由于太专业,这里不做过多解释
【 Replace missing value对话框】 用于填充缺失值,结果存入一个新变量。填充方法有:序列的均数、相邻若 干点的均数、相邻若干点的中位数、线性内插、线性外延,默认值为序列的均数 2.2.2数据的录入 2.2.2.1直接录入 我想直接录入的问题就不用多讲了吧,直接敲就是了! 2.2.2.2数据录入技巧 和其他常用统计软件相比,SPSS数据界面最大的优势就是支持鼠标的拖放 操作,以及拷贝粘贴等命令,下面的数据录入技巧就是对这些功能的利用 【连续多个相同值的输入】 如前面 group变量有连续多个1,如果直接输入,可以在第一格内输入1并 回车,然后回到刚才的单元格并单击右键,选择copy,最后用拖放方式选中所 有应输入1的单元格,单击右键并选择 paste,所有选中的单元格就会都被刚才 拷贝的1填充。 【将 EXCEL数据直接引入SPSS】 Excel己经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方 法将数据引入SPSS:先在 EXCEL中选中所有的数据(不包括变量名),然后选 择拷贝命令;然后切换到SPSS,最好使行1列1单元格成为当前单元格,然后 执行粘贴命令,数据就会全部转入SPSS,再定义相应的变量即可。 2.3进一步整理数据文件-Data菜单 在许多情况下,我们需要先对数据进行一些整理(如分组、合并、加权等) 才能将其用于最终的统计分析。这些功能基本上都集中在Data菜单项中,下面 我们就对这些对话框做逐一介绍 2.3.1用于数据管理的菜单项 【 Sort cases对话框】 例2.5对数据集1il1.sav按 group升序,x降序的次序排列
【Replace Missing Value 对话框】 用于填充缺失值,结果存入一个新变量。填充方法有:序列的均数、相邻若 干点的均数、相邻若干点的中位数、线性内插、线性外延,默认值为序列的均数。 2.2.2 数据的录入 2.2.2.1 直接录入 我想直接录入的问题就不用多讲了吧,直接敲就是了! 2.2.2.2 数据录入技巧 和其他常用统计软件相比,SPSS 数据界面最大的优势就是支持鼠标的拖放 操作,以及拷贝粘贴等命令,下面的数据录入技巧就是对这些功能的利用。 【连续多个相同值的输入】 如前面 group 变量有连续多个 1,如果直接输入,可以在第一格内输入 1 并 回车,然后回到刚才的单元格并单击右键,选择 copy,最后用拖放方式选中所 有应输入 1 的单元格,单击右键并选择 paste,所有选中的单元格就会都被刚才 拷贝的 1 填充。 【将 EXCEL 数据直接引入 SPSS】 Excel 已经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方 法将数据引入 SPSS:先在 EXCEL 中选中所有的数据(不包括变量名),然后选 择拷贝命令;然后切换到 SPSS,最好使行 1 列 1 单元格成为当前单元格,然后 执行粘贴命令,数据就会全部转入 SPSS,再定义相应的变量即可。 2.3 进一步整理数据文件--Data 菜单 在许多情况下,我们需要先对数据进行一些整理(如分组、合并、加权等) 才能将其用于最终的统计分析。这些功能基本上都集中在 Data 菜单项中,下面 我们就对这些对话框做逐一介绍。 2.3.1 用于数据管理的菜单项 【Sort Cases 对话框】 例 2.5 对数据集 li1_1.sav 按 group 升序,x 降序的次序排列
解:选择菜单Data=> Sort cases,系统弹出 Sort cases对话框,该对话 框并不复杂,其中比较特殊的是下方的 Sort order单选钮,有升序和降序两种 选择。请注意,该单选钮是和上方的 Sort By框一起使用的,具体方法如下 1.确认升序单选钮被选择,将 Group选λ Sort By框; 2.选择降序单选钮,将x选入 Sort By框。 争组变量goup Sort b OK 值冈 Sort Order Cancel c Ascending CD Help 请注意: group和x后面分别跟着 Ascending和 Descending,表明前者是按 升序、后者按降序排列;由于 Group在前,因此排序时以 Group优先。 【 Transpose对话框】 该对话框用于对数据进行行列转置,可以在原数据文件中指定一个变量记录 转置后的变量名。原变量名则自动保存在系统产生的名为case_1b的字符变量 中 该对话框也非常简单,左侧为候选变量框;右上方为 Variable框,用于选 入需要转置的变量,一般应选入除名称变量外的所有其他变量,如果有变量未选 入,则转置时会被自动丢弃;右下方为 Name variable框,用于指定原数据文件 中记录转置后变量名的字符变量,但不是必需的,此时系统会将新变量自动按 var00l、var002...的顺序命名。 【 Merge Files对话框】 用于合并数据文件,实际上包括了两个对话框,分别对应了两种合并方式: 从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用Add Cases对话框完成,相互合并的数据文件中应该有相同的变量。选择菜单 Data=> Merge files= Add cases,系统首先弹出打开数据文件对话框,选中需 要添加的数据文件并按OK,系统才弹出 Add Cases对话框,左侧显示的是新、 老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用 Rename 按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配 的两个变量再单击Pair钮)。右下方的 Indicate case source as variable
解:选择菜单 Data==>Sort Cases,系统弹出 Sort Cases 对话框,该对话 框并不复杂,其中比较特殊的是下方的 Sort Order 单选钮,有升序和降序两种 选择。请注意,该单选钮是和上方的 Sort By 框一起使用的,具体方法如下: 1. 确认升序单选钮被选择,将 Group 选入 Sort By 框; 2. 选择降序单选钮,将 x 选入 Sort By 框。 请注意:group 和 x 后面分别跟着 Ascending 和 Descending,表明前者是按 升序、后者按降序排列;由于 Group 在前,因此排序时以 Group 优先。 【Transepose 对话框】 该对话框用于对数据进行行列转置,可以在原数据文件中指定一个变量记录 转置后的变量名。原变量名则自动保存在系统产生的名为 case_lbl 的字符变量 中。 该对话框也非常简单,左侧为候选变量框;右上方为 Variable 框,用于选 入需要转置的变量,一般应选入除名称变量外的所有其他变量,如果有变量未选 入,则转置时会被自动丢弃;右下方为 Name Variable 框,用于指定原数据文件 中记录转置后变量名的字符变量,但不是必需的,此时系统会将新变量自动按 var001、var002...的顺序命名。 【Merge Files 对话框】 用于合并数据文件,实际上包括了两个对话框,分别对应了两种合并方式: 1. 从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用 Add Cases 对话框完成,相互合并的数据文件中应该有相同的变量。选择菜单 Data==>Merge Files==>Add Cases,系统首先弹出打开数据文件对话框,选中需 要添加的数据文件并按 OK,系统才弹出 Add Cases 对话框,左侧显示的是新、 老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用 Rename 按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按 Ctrl 键选中匹配 的两个变量再单击 Pair 钮)。右下方的 Indicate case source as variable