问:你只有10平方米的房屋,邻居从90平方米换到190平方米,你的居住面积有没有增加?
答:没有。
错,你在平均住房面积里增加了50平方米。
这虽然是有关平均数的一则笑话,却能够说明我们常常会被各种统计数字所欺骗和愚弄,忘记了这些数字也许是被精心挑选出来的,也许会有水分。
统计的陷阱在哪里呢?首先是统计本身的不真实性,比如统计样本的选择偏差,或是样本空间过小,导致代表性差。
统计样本的选择偏差是比较常见的,由于调查者的主管意向或者客观失误的影响,统计样本的选择偏差会直接影响到统计的结果。
比如,你有一桶豆子,有红色的,有白色的,那么红色的豆子有多少呢?如果按照统计学的办法,就是抓一把豆子(抽样),延后算一下红白豆子的比例就能够得到近似的结果。但这个前提是,红白豆子在体积、形状、重量上无差异化。如果是大豆子和小豆子呢?按照物理学的原理,小豆子会在桶的下面,而大豆子在上面,如果你在上面抓一把样本,就是大豆子多;在桶底抓一把样本,就是小豆子多。
另一个陷阱在于统计之后的分析过程。在分析中,统计者是否遗漏了什么,或者忽视了统计所依赖的条件。例如,某年公布的数据显示,该年4月份的零售额高于去年同期,于是证明经济开始进入复苏阶段。但遗漏的内容是前一年的复活节在3月,而该年的复活节在4月,所以复活节带来的消费高峰在4月。暂时的消费高峰并不能代表经济的转向。
真正的了解统计数字,破除它身上的神秘感,你才会理解地站在各种各样的数字面前,坦然地做出正确的判断与选择。了解种种统计数字蕴含的奥秘以及深藏的猫腻,不会让你成为骗人的高手,却能够让你在伪装成科学模样的统计数字面前,变的足够智慧和强大。
所属专题: