数据会说话?数据会说谎!
事先声明……今天上午10点,国家统计局发布的中国第三季度GDP年率增长7.3%,尽管稍强于预期,但还是创五年半最慢增速的这个数据货真价
事先声明……今天上午10点,国家统计局发布的中国第三季度GDP年率增长7.3%,尽管稍强于预期,但还是创五年半最慢增速的这个数据货真价实,千真万确,不适用于此“数据会说谎”系列……
人常说数据是会说话的,实则不然,数据还是会说谎的。关于数据和说谎的关系,说“统计数据会说谎”,那是读数据的人不够专业;说“利用统计数据说谎”,那是做数据的人太“专业”。其实还有第三种关系,那就是数据不说谎,做数据的人也不想说谎,但读数据的人只想读到自己想读到的数据。
究竟是数据在说谎,还是逻辑在说谎?
1)在趋势图中,为了说明增长趋势多明显,把Y调成不从0开始。这样差距会看起来很大,增长很大,但是如果把Y轴从0开始看的话,会显得基本没有差距。
差距够大吧!!!巨量增长啊!我们公司的财务情况这样的话,公司明年就得IPO啊!!
可惜Y从0开始的话,这图应该看起来的样子是:
2) 另外一个例子,作两两比较的时候把Y的值从高位开始,造成俩差距巨大的错觉
看啊,右边比左边高了4倍不止!!!咦,等等,不是就39.6%跟35%的差别吗....这...
3) 挑取x轴的数据以捏造趋势
假设 数据的波动性很大,比如说如下
10, 1, 20, 3, 30, 4, 50
看起来应该是
擦勒,公司的财务状况这么不稳定!!!怎么办!
没关系——如果我只抽取奇数项的话(挑取x轴,虽然挑得好像是很有系统地——奇数,但是你总能想到一个看着挑得系统的方法)
就会看着像
TMD明年又可以上市了。。。
等等等等...
4)那些神奇的伪相关
(金融市场网整理自知乎)
表情