正在加载图片...
本身的特点及数据的多少有关。由于分组目的之一是为了观察数据分 布的特征,因此组数的多少应适中。若组数太少,数据的分布就会过 于集中,而组数太多,数据的分布就会过于分散,这都不便于观察数 据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规 律为目的。在实际分组时,可以按 Sturges提出的经验公式来确定组数 k=1+恕n lg 2 式中,n为数据的个数,对结果用四舍五入的办法取整数即为组数。例 如,对例33中的数据有:K=1+lg50÷1g2≈7,即应分为7个组。当 然,这只是一个经验公式,实际应用时,可根据数据的多少和特点及 分析的要求,参考这一标准灵活确定组数。 第二步:确定各组的组距。组距( Class width)是一个组的上限与 下限之差,可根据全部数据的最大值和最小值及所分的组数来确定 即组距=(最大值一最小值)÷组数。例如,对于例3-3的数据,最 大值为139,最小值为107,则组距=(139-107)÷7=46。为便于 计算,组距宜取5或10的倍数,而且第一组的下限应低于最小变量值 最后一组的上限应高于最大变量值,因此组距可取5。 第三步:根据分组整理成频数分布表。比如对上面的数据进行分 组,可得到下面的频数分布表。见表3-5。 表3-5 某车间50名工人日加工零件数分组表 按零件数分组(个) 频数(人) 率(%) 105~110 l10~115 358 125~130 606802 6 合计 50 100 采用组距分组时,一定要遵循“不重不漏”的原则。“不重”是指 项数据只能分在其中的某一组,不能在其它组中重复出现;“不漏” 是指在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。 为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”本身的特点及数据的多少有关。由于分组目的之一是为了观察数据分 布的特征,因此组数的多少应适中。若组数太少,数据的分布就会过 于集中,而组数太多,数据的分布就会过于分散,这都不便于观察数 据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规 律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数 K: lg 2 lg 1 n K=+ 式中,n 为数据的个数,对结果用四舍五入的办法取整数即为组数。例 如,对例 3.3 中的数据有:K=1+lg50÷lg2≈7,即应分为 7 个组。当 然,这只是一个经验公式,实际应用时,可根据数据的多少和特点及 分析的要求,参考这一标准灵活确定组数。 第二步:确定各组的组距。组距(Class width)是一个组的上限与 下限之差,可根据全部数据的最大值和最小值及所分的组数来确定, 即组距=(最大值-最小值)÷组数。例如,对于例 3–3 的数据,最 大值为 139,最小值为 107,则组距=(139-107)÷7=4.6。为便于 计算,组距宜取 5 或 10 的倍数,而且第一组的下限应低于最小变量值, 最后一组的上限应高于最大变量值,因此组距可取 5。 第三步:根据分组整理成频数分布表。比如对上面的数据进行分 组,可得到下面的频数分布表。见表 3–5。 表 3-5 某车间 50 名工人日加工零件数分组表 按零件数分组(个) 频数(人) 频率(%) 105~110 110~115 115~120 120~125 125~130 130~135 135~140 3 5 8 14 10 6 4 6 10 16 28 20 12 8 合计 50 100 采用组距分组时,一定要遵循“不重不漏”的原则。“不重”是指 一项数据只能分在其中的某一组,不能在其它组中重复出现;“不漏” 是指在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。 为解决“不重”的问题,统计分组时习惯上规定“上组限不在内
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有