2020年2月5日 星期三

數學與統計的差異

我還真沒想過有一天我會需要嘗試跟劇組解釋這個真是有夠難解釋的概念,基於我覺得我這次講出來的這個範例感覺以後上課會有點用,所以就容我趁機記錄下來。

先簡單的說,對於無相關背景的人,數學跟統計感覺都是研究數字的行業。但事實上,它們的思考方向可以說非常不同,甚至在某種程度上是相反的。

為了說明這件事情,讓我們就拿武漢肺炎來舉例好了。對於一個數學的人,他可能會考慮像這樣的問題:

假設現在有1個帶原者,而我知道每個帶原者每天會傳染給一個新的人,則每天總感染人數會翻倍,過了n天就有2的n次方的人被感染,過了10天就2的10次方 = 1024個人了。

但對於一個統計的人,他可能會考慮像這樣的問題:

假設我前天看到有1個帶原者,昨天看到2個,今天看到4個,每天都翻倍...但等等,這真的代表現在已經會人傳人了嗎?還是新的人只是從境外新跑進來的,並不是從原本的帶原者傳染過去的?我又要怎麼驗證這件事情?

差別是什麼?

  • 數學面對的世界是:我們已經知道世界的真實(有多少帶原者/以什麼方式傳染),然後想去推論對應的數學元件(感染人數)會有什麼行為。以更數學的語言就是:我們已經知道公理為真,然後看能夠證明多少定理。
  • 統計面對的世界則是:我們只看到數學元件(感染人數),然後想要去倒推世界的真實(有多少帶原者/以什麼方式傳染),這之中很大部分則是去思考各種可能的變因(會不會是境外的人而非境內人傳人),又要如何去驗證它(追蹤感染者之前的接觸史等)
是的,兩者都會接觸數字,也共用很多像是機率類的工具,但它們接觸數字的立場非常不一樣。一個是已知世界的真實,研究數學元件。另一個則是看到數學元件,要去猜世界的真實。

這之間的差異已經大到說,其實有很多數學很好的人,完全跨不到統計這一塊,因為概念上無法轉換。也甚至已經大到說,其實有很多統計很好的人,他不太需要數學的論證能力,反而需要對數字的敏銳度,"等等這數字不對,會不會其實這個才是原因?"

剛好想到一個這樣的說明方法,速速記下來一下。