癥結不是在數字,而是在立場

然後講一個其實是常識的事情,所謂平均值通常是用在不同集合之間橫向之間比較,不是用在集合內的個體比較

好比說平均收入,平均收入這個指標是用在不同國家之間比較,不是用在國內個體之間比較,個體之間比較使用的指標是中位數收入,這是因為不同指標想要展現的數據不一樣。

簡單說,按照二八法則,一個社會裡面百分之二十的人擁有百分之八十的資產,剩下百分之八十的人擁有百分之二十的資產,那麼若總資產是一百,人口也是一百,前面百分之二十的人平均擁有4,後面百分之八十也就是佔據大部份人口的平均資產只有0.25,然而你只看平均收入的話算出來卻是平均每個人擁有1,那當然富人也覺得哪有這麼少?可是大多數人都覺得這個數字是假的吧?

大部份情況底下一個社會的平均收入這個指標,並不能看成『我應該擁有的』,反而大部份情況可以視作普通人收入的天花板,這是因為收入本來就不是平均分佈,可是這樣就要說『既然它不準確,那這個數字有什麼用?』那也不對,因為它是衡量不同國家之間的指標,因為就算不同的國家之間財富分配也不會差距太大,所以如果甲國的平均收入是乙國的兩倍,那麼我們用不著細細每一個行業去分析,就可以假設『相同工作、相同階級的人』底下,甲國的收入大約是乙國的兩倍,特例當然會有很多,可是大部份情況會是準確的,這種指標是這樣子使用。

而想要衡量個人之間的差異,使用的是另一種指標,收入中位數,所謂收入中位數,就是把一百個人的收入從高至低排序,最中間的那個人收入是多少,你的收入如果比他高,你就可以確認你在這群人中間屬於高收入,比他低的話你就知道自己屬於低收入,個人中間用這種指標衡量的話就是準確的,但是拿它來衡量國家跟國家之間的差距的話它又會變得不準確,要改用平均收入比較準確。

所謂統計這樣,它是為了用簡單的數據讓人可以快速判斷某些事情,它的目的不是呈現繁雜完整的數據,而是反過來,必須刪減不重要的部份讓最後的結果盡量簡單的同時不會有太大誤差,讓看的人能夠省去大量去從複雜資訊分析的時間,因此它是一種『刪減的藝術』,如何刪減、刪減哪些部份才能讓資訊簡化的同時不會減損必要資訊的正確性,我想呈現的是人口變動,那就把對此不重要的資訊都刪減,此時這份數據就是用來判讀人口變動的,可是你如果拿這份資訊比對職業分佈那就不準確了,因為它不是為此統計的數據。

因此才有人會說統計是一門說謊的藝術,因為既然統計時必須要對不重要的資訊刪減,那麼如果有人惡意地使用統計方法,如果他不是將不重要的資訊刪減,而是將不想讓你知道的資訊刪減,那麼出來的數字自然是他想要讓你相信是什麼,數字就會是什麼,此時這個數字就是用來欺騙,而不是呈現真實情況。

統計的方式可以造假,就算完全真實的統計數據,用錯誤的解讀方式也可以造假,好比上面的例子,我把平均收入跟收入中位數顛倒方式解讀,就可以把經濟成長的國家硬說成民不聊生,把惡性通縮的國家硬說成蒸蒸日上的。

很多東西癥結總不是在數字,也不是在統計,而是在立場的。

< 資料來源:周布雅facebook引用網址 >
分享文章:

最新文章: