镑,另一半家庭的年收入不及2000英镑。我还可以利用众数一所有家庭收入序 列中出现次数最多的那个收入。例如,附近的居民中年收入为3000英镑的家庭 数是最多的,那么收入的众数就是一年3000英镑 在这个例子中,不合适的"平均数"实际上是毫无意义的,只要碰到关于收入 的数据,这种情况就经常出现。还有一个因素会让我们困惑不已一某种条件下, 各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们 比方说,当你看到某个原始部落男性的平均身高为5英尺时,你对这些人的 外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数 或者众数,因为此时各种平均数的数值大致相等。(当然,如果你正在为非洲人 赶制一批制服,那么就需要比平均数更多的信息,你要用到全距和标准差,这些 我们将在下一章进行介绍。) 在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有 我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形 的曲线,均值、中位数和众数都落在相同的点上。 在描述人类身高时,用哪种平均数无关紧要,但在描述他们的钱袋时,却并 不是那么回事儿了。如果把某个城市所有家庭的年收入都列出来,你会发现,这 些数从很小的值变动到很大的数,也许有20000英镑左右,甚至还能看到少数巨 额收入。年收入低于5000英镑所占的比例超过了95%,在收入曲线上朝左边拖 出了一条长长的尾巴。这种分布不再像钟形一样对称,而是有偏的,它的形状类 似于孩子玩的滑梯,梯子一侧是陡斜地升到顶部,而滑道一侧则缓慢向下倾斜。 均值与中位数相差甚远,这样一来,比较去年的″平均数"(均值)与今年的"平 均数”(中位数),这种比较的有效性就不言而喻了 平均数的代表性 在我卖给你房子所在的居民区里,两个平均数的差距如此之大,因为收入是 显著偏斜的。你的邻居中大多数都是小农、在附近村庄上班的工薪阶层或是靠养 老金为生的退休老人,但有3户邻居是百万富翁,他们仅仅是来此度周末。就是 这3户邻居的收入提高了总收入,相应地抬高了算术平均数。这样一来,均值达 到了绝大多数家庭遥不可及的水平,几乎每个人都低于平均数。虽然这听起来像 是笑话或者文学修辞,但的确是不争的事实。2 镑,另一半家庭的年收入不及 2000 英镑。我还可以利用众数--所有家庭收入序 列中出现次数最多的那个收入。例如,附近的居民中年收入为 3000 英镑的家庭 数是最多的,那么收入的众数就是一年 3000 英镑。 在这个例子中,不合适的"平均数"实际上是毫无意义的,只要碰到关于收入 的数据,这种情况就经常出现。还有一个因素会让我们困惑不已--某种条件下, 各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们。 比方说,当你看到某个原始部落男性的平均身高为 5 英尺时,你对这些人的 外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数 或者众数,因为此时各种平均数的数值大致相等。(当然,如果你正在为非洲人 赶制一批制服,那么就需要比平均数更多的信息,你要用到全距和标准差,这些 我们将在下一章进行介绍。) 在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有 我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形 的曲线,均值、中位数和众数都落在相同的点上。 在描述人类身高时,用哪种平均数无关紧要,但在描述他们的钱袋时,却并 不是那么回事儿了。如果把某个城市所有家庭的年收入都列出来,你会发现,这 些数从很小的值变动到很大的数,也许有 20000 英镑左右,甚至还能看到少数巨 额收入。年收入低于 5000 英镑所占的比例超过了 95%,在收入曲线上朝左边拖 出了一条长长的尾巴。这种分布不再像钟形一样对称,而是有偏的,它的形状类 似于孩子玩的滑梯,梯子一侧是陡斜地升到顶部,而滑道一侧则缓慢向下倾斜。 均值与中位数相差甚远,这样一来,比较去年的"平均数"(均值)与今年的"平 均数"(中位数),这种比较的有效性就不言而喻了。 二、平均数的代表性 在我卖给你房子所在的居民区里,两个平均数的差距如此之大,因为收入是 显著偏斜的。你的邻居中大多数都是小农、在附近村庄上班的工薪阶层或是靠养 老金为生的退休老人,但有 3 户邻居是百万富翁,他们仅仅是来此度周末。就是 这 3 户邻居的收入提高了总收入,相应地抬高了算术平均数。这样一来,均值达 到了绝大多数家庭遥不可及的水平,几乎每个人都低于平均数。虽然这听起来像 是笑话或者文学修辞,但的确是不争的事实