第2章数据的组织与表达 Arrangement and Presentation of Data
第2章 数据的组织与表达 Arrangement and Presentation of Data
Section 2.1 Data and Data Type 数据与数据类型
Section 2.1 Data and Data Type 数据与数据类型
一、原始数据的组织 >资料以电子表格(spreadsheet)方式记录。 ·包括个体(Individual):一笔数据所描述 的对象(object).。电子表格中输入在一行。 ·及变量(Variable):描述任何一个个体 的特征,一个变量对不同的个体取不同的数 值(value)。电子表格中输入在一列
一、原始数据的组织 ➢ 资料以电子表格(spreadsheet)方式记录。 ▪ 包括个体 (Individual):一笔数据所描述 的对象(object)。电子表格中输入在一行。 ▪ 及变量( Variable ) :描述任何一个个体 的特征,一个变量对不同的个体取不同的数 值(value)。电子表格中输入在一列
二、试验资料的性质与分类 (一)数量性状资料 数量性状(quantitative trait)的度量有计数和量测两种 方式,其所得变数不同。 1.不连续性或间断性变数(discontinuous or discrete variable)指用计数方法获得的数据。 2.连续性变数(continuous variable)指称量、度量或测 量方法所得到的数据,其各个观察值并不限于整数,在两个 数值之间可以有微量数值差异的第三个数值存在
(一) 数量性状资料 数量性状(quantitative trait)的度量有计数和量测两种 方式,其所得变数不同。 1. 不连续性或间断性变数( discontinuous or discrete variable ) 指用计数方法获得的数据。 2. 连续性变数( continuous variable ) 指称量、度量或测 量方法所得到的数据,其各个观察值并不限于整数,在两个 数值之间可以有微量数值差异的第三个数值存在。 二、试验资料的性质与分类
二、试验资料的性质与分类 (二)质量性状资料 质量性状(qualitative trait)指能观察而不能量测的状即 属性性状,如花药、子粒、颖壳等器官的颜色、芒的有 无、绒毛的有无等。要从这类性状获得数量资料,可采 用下列两种方法: 1.统计次数法于一定总体或样本内,统计其具有某个性 状的个体数目及具有不同性状的个体数目,按类别计其 次数或相对次数。 2.给分法给予每类性状以相对数量的方法
(二) 质量性状资料 质量性状( qualitative trait )指能观察而不能量测的状即 属性性状,如花药、子粒、颖壳等器官的颜色、芒的有 无、绒毛的有无等。要从这类性状获得数量资料,可采 用下列两种方法: 1. 统计次数法 于一定总体或样本内,统计其具有某个性 状的个体数目及具有不同性状的个体数目,按类别计其 次数或相对次数。 2. 给分法 给予每类性状以相对数量的方法 二、试验资料的性质与分类
Section 2.2 坎数分布表
Section 2.2 次数分布表
间断性变数资料的整理 表1100个麦穗的每穗小穗数 18 15 16 15 20 19 17 17 18 16 18 20 19 17 16 18 17 18 18 18 18 17 17 16 18 18 16 19 18 17 18 20 19 18 10 17 16 15 16 18 17 18 17 17 16 19 17
表1 100个麦穗的每穗小穗数 18 15 17 19 16 15 20 18 19 17 17 18 17 16 18 20 19 17 16 18 17 16 17 19 18 18 17 17 17 18 18 15 16 18 18 18 17 20 19 18 17 19 15 17 17 17 16 17 18 18 17 19 19 17 19 17 18 16 18 17 17 19 16 16 17 17 17 15 17 16 18 19 18 18 19 19 20 17 16 19 18 17 18 20 19 16 18 19 17 16 15 16 18 17 18 17 17 16 19 17 一、 间断性变数资料的整理
间断性变数资料的整理 每穗小穗数在15一20的范围内变动, 表2100个麦穗每穗小 穗数的次数分布表 把所有观察值按每穗小穗数多少加 每穗小穗数 以归类,共分为6组,组与组间相差 (y) 次数(f) 为1小穗,称为组距。这样可得表2 15 6 形式的次数分布表。 16 15 从表2中看到,一堆杂乱的原 17 32 18 25 始资料表,经初步整理后,就可了 19 17 解资料的大致情况,另外,经过整 20 5 理的资料也便于进一步的分析。 总次数(n) 100
每穗小穗数 ( y ) 次数( f ) 15 6 16 15 17 32 18 25 19 17 20 5 总次数(n) 100 表2 100个麦穗每穗小 穗数的次数分布表 从表2中看到,一堆杂乱的原 始资料表,经初步整理后,就可了 解资料的大致情况,另外,经过整 理的资料也便于进一步的分析。 每穗小穗数在15—20的范围内变动, 把所有观察值按每穗小穗数多少加 以归类,共分为6组,组与组间相差 为1小穗,称为组距。这样可得表2 形式的次数分布表。 一、 间断性变数资料的整理
连续性变数资料的整理 表3140行水稻产量(单位:克) 177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165 214 95 158 83 137 80 138 151 187 126 196 134 206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 163 176 102 194 145 173 75 130 149 150 161 155 111 158 131 189 91 142 140 154 152 163 123 205 149 155 131 209 183 97 119 181 149 187 131 215 111 186 118 150 155 197 116 254 239 160 172 179 151 198 124 179 135 184 168 169 173 181 188 211 197 175 122 151 171 166 175 143 190 213 192 231 163 159 158 159 177 147 194 227 141 169 124 159
二、 连续性变数资料的整理 177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165 214 95 158 83 137 80 138 151 187 126 196 134 206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 163 176 102 194 145 173 75 130 149 150 161 155 111 158 131 189 91 142 140 154 152 163 123 205 149 155 131 209 183 97 119 181 149 187 131 215 111 186 118 150 155 197 116 254 239 160 172 179 151 198 124 179 135 184 168 169 173 181 188 211 197 175 122 151 171 166 175 143 190 213 192 231 163 159 158 159 177 147 194 227 141 169 124 159 表3 140行水稻产量(单位:克)
连续性变数资料的整理 具体步骤: 1.数据排序(so)首先对数据按从小到大排列(升序) 或从大到小排列(降序)。 2.求极差(range)所有数据中的最大观察值和最小 观察值的差数,称为极差,亦即整个样本的变异幅度。 从表3中查到最大观察值为254g,最小观察值为75g, 极差为254一75=179g
具体步骤: 1. 数据排序(sort) 首先对数据按从小到大排列(升序) 或从大到小排列(降序)。 2. 求极差(range) 所有数据中的最大观察值和最小 观察值的差数,称为极差,亦即整个样本的变异幅度。 从表3中查到最大观察值为254g,最小观察值为75g, 极差为254-75=179g。 二、 连续性变数资料的整理