統計學和計量經濟學有什麼區別?

語言: CN / TW / HK

我是計量經濟學理論方向的在讀博士生,做過本科計量經濟學和博士計量經濟學的助教,看到這個經典的問題,也來貢獻一下看法。

計量經濟學和統計學的區別根源之一,在於關心的重點不同。統計學關心的是相關性(correlation),而計量經濟學關心的是因果性(causality)。為什麼它們關心的重點不同?因為兩個學科所服務的研究主題和研究方式不同。

具體而言,統計學通常服務於可實驗性更高的學科,例如生物學,醫學等。而計量經濟學服務於實驗性不那麼高的學科,例如經濟學,金融學,社會學等。實驗性高是指什麼呢?舉個例子,我們想要研究一種藥物對改變某個基因表達的影響,我們可以設計一個控制變數實驗來研究。“控制變數”就是實驗的一個重要特徵。如果實驗組和對照組相比,改變的變數只有一個,那麼二組在結果變數上的區別可以直接歸因於這個單一的因變數。實驗性高有什麼好處呢?大家都知道,迴歸係數本身只是一個相關關係的大小,而實驗性高的好處就在於,通過控制變數,收集實驗資料,進行迴歸分析(regression),我們可以把估計出的迴歸引數(estimated coefficient )直接看成因果關係的大小,因此統計學在這裡不需要刻意區分相關性與因果性。然而,在社會經濟類學科中,我們就很難保證實驗性了。試想,我們要研究一項經濟政策對人們收入的影響,難道我們能把全國人民隨機分組,然後一組實行政策,另一組不實行嗎?這是幾乎不可能做到的。那麼這個研究要如何進行下去呢?我們只能試圖依賴已經觀測到的經濟資料來分析。相比完美的實驗資料,觀測到的資料不再具備“控制變數”這麼好的性質(也就是有“內生性”),那怎麼辦呢?我們只能退而求其次,對簡單的迴歸模型施加更多假設。這就進入了計量經濟學的範疇:如何施加不過分(合理)的假設,以得到一個“差不多像做實驗一樣”的識別條件,從而保證我們依然能夠將回歸結果中的“相關關係”詮釋為“因果關係”。在這個過程中,我們施加的假設,有些是可以用資料做“證據”來說明其合理性的,有些則沒有資料說話,而只能依賴經濟學邏輯分析。具體情況不同,我們挑選的假設也可以不同,所以計量經濟學家開發了適用於不同場景的豐富模型。這些計量模型,與傳統的統計學中出現的模型相比,已經走出了一條深遠的,不一樣的道路。

總結一下:為了服務不同特點的研究內容與研究目的,統計學和計量經濟學的區別由此展開。具體的區別包括:模型假設的不同、資料形式和資料假設不同(例如,很多統計學模型更強調資料正態分佈的假設,而經濟學資料大多是不符合這個假設的)、假設檢驗的理論依據不同(例如,統計學模型有一部分是有限樣本檢驗,而經濟資料通常是大樣本,檢驗時用的是大樣本近似理論)等等等等。還有很多因這些基本的不同而衍生出的許許多多區別,這就形成了兩門看上去非常相似實際上卻各自自成一脈的學科。

當然,學好兩門學科中的任意一門都有助於加深對另一門的理解和運用,前提是我們可以清晰地辨別二者的異同,並理解各種緣由。希望我的答案能對各位對這個問題的理解產生一點積極貢獻。


btw,對於有限樣本(finite sample)和大樣本(large sample)理論的區別,以及計量經濟學和統計學在運用這兩個理論時的區別,還可以多討論幾句。在傳統的統計學的OLS中,我們會注意到一個經常出現的假設:error term follows a Gaussian distribution,即誤差項是正態分佈的。與其他假設相結合,我們能得到的結論是,在對OLS模型的估計量進行單個假設檢驗的時候,檢驗統計量(testing statistics)服從一個 t 分佈。這個 t 分佈的自由度n等於樣本量的大小n,是一個精確的分佈。意思是說,對於不同資料集的不同樣本大小,這個 t 分佈對應的自由度也相應變化。當樣本量趨向於無限大時,t分佈趨向於標準正態分佈。而在統計學的假設檢驗中,我們已知具體的樣本大小n,能計算精確的統計量分佈,而t值,p值,查表值,置信區間(confidence interval)等,都是基於精確的 t(n)分佈的。

那麼,在計量經濟學中會有什麼不同呢?首先,我們丟掉正態分佈的假設,因為在絕大多數情況下,它不符合經濟資料的特徵。沒了這個假設,還能推出針對有限樣本n的統計量分佈嗎?不能了。那還可以繼續做假設檢驗嗎?可以。如何做?我們運用基於大樣本理論的假設檢驗。為什麼可以用大樣本理論?因為在經濟學研究中,資料集一般是很大的,少也有幾百,大可以到幾萬甚至更多,在這樣大的樣本下,我們可以想象,樣本量最終有機會趨向於無窮大。有了腦子裡的這個想象,我們可以用統計量近似服從(在n無窮大時)的分佈來做假設檢驗。根據大樣本理論,我們知道,標準化後的檢驗統計量近似服從一個標準正態分佈。這就是為什麼在計量經濟學中,0.05水平假設檢驗的 t 值,永遠是和1.96比較的。因為1.96是標準正態分佈的97.5%分位數,我們用它,其實是在用大樣本近似。希望這幾句補充可以給統計學和計量經濟學的區別新增一個佐證。



來源:知乎 www.zhihu.com
作者:小吉

【知乎日報】千萬使用者的選擇,做朋友圈裡的新鮮事分享大牛。 點選下載

此問題還有 67 個回答,檢視全部。
延伸閱讀:
計量經濟學或者統計學證明了哪些「似乎不可能」存在的聯絡?
計量經濟學所談論的「因果」是什麼意思?