先簡單的說,對於無相關背景的人,數學跟統計感覺都是研究數字的行業。但事實上,它們的思考方向可以說非常不同,甚至在某種程度上是相反的。
為了說明這件事情,讓我們就拿武漢肺炎來舉例好了。對於一個數學的人,他可能會考慮像這樣的問題:
假設現在有1個帶原者,而我知道每個帶原者每天會傳染給一個新的人,則每天總感染人數會翻倍,過了n天就有2的n次方的人被感染,過了10天就2的10次方 = 1024個人了。
但對於一個統計的人,他可能會考慮像這樣的問題:
假設我前天看到有1個帶原者,昨天看到2個,今天看到4個,每天都翻倍...但等等,這真的代表現在已經會人傳人了嗎?還是新的人只是從境外新跑進來的,並不是從原本的帶原者傳染過去的?我又要怎麼驗證這件事情?
差別是什麼?
- 數學面對的世界是:我們已經知道世界的真實(有多少帶原者/以什麼方式傳染),然後想去推論對應的數學元件(感染人數)會有什麼行為。以更數學的語言就是:我們已經知道公理為真,然後看能夠證明多少定理。
- 統計面對的世界則是:我們只看到數學元件(感染人數),然後想要去倒推世界的真實(有多少帶原者/以什麼方式傳染),這之中很大部分則是去思考各種可能的變因(會不會是境外的人而非境內人傳人),又要如何去驗證它(追蹤感染者之前的接觸史等)
是的,兩者都會接觸數字,也共用很多像是機率類的工具,但它們接觸數字的立場非常不一樣。一個是已知世界的真實,研究數學元件。另一個則是看到數學元件,要去猜世界的真實。
這之間的差異已經大到說,其實有很多數學很好的人,完全跨不到統計這一塊,因為概念上無法轉換。也甚至已經大到說,其實有很多統計很好的人,他不太需要數學的論證能力,反而需要對數字的敏銳度,"等等這數字不對,會不會其實這個才是原因?"
剛好想到一個這樣的說明方法,速速記下來一下。