統計學和計量經濟學有什麼區別？

語言: CN / TW / HK

時間 2022-02-20 12:03:49 知乎每日精華

我是計量經濟學理論方向的在讀博士生，做過本科計量經濟學和博士計量經濟學的助教，看到這個經典的問題，也來貢獻一下看法。

計量經濟學和統計學的區別根源之一，在於關心的重點不同。統計學關心的是相關性（correlation），而計量經濟學關心的是因果性（causality）。為什麼它們關心的重點不同？因為兩個學科所服務的研究主題和研究方式不同。

具體而言，統計學通常服務於可實驗性更高的學科，例如生物學，醫學等。而計量經濟學服務於實驗性不那麼高的學科，例如經濟學，金融學，社會學等。實驗性高是指什麼呢？舉個例子，我們想要研究一種藥物對改變某個基因表達的影響，我們可以設計一個控制變數實驗來研究。“控制變數”就是實驗的一個重要特徵。如果實驗組和對照組相比，改變的變數只有一個，那麼二組在結果變數上的區別可以直接歸因於這個單一的因變數。實驗性高有什麼好處呢？大家都知道，迴歸係數本身只是一個相關關係的大小，而實驗性高的好處就在於，通過控制變數，收集實驗資料，進行迴歸分析（regression），我們可以把估計出的迴歸引數（estimated coefficient ）直接看成因果關係的大小，因此統計學在這裡不需要刻意區分相關性與因果性。然而，在社會經濟類學科中，我們就很難保證實驗性了。試想，我們要研究一項經濟政策對人們收入的影響，難道我們能把全國人民隨機分組，然後一組實行政策，另一組不實行嗎？這是幾乎不可能做到的。那麼這個研究要如何進行下去呢？我們只能試圖依賴已經觀測到的經濟資料來分析。相比完美的實驗資料，觀測到的資料不再具備“控制變數”這麼好的性質（也就是有“內生性”），那怎麼辦呢？我們只能退而求其次，對簡單的迴歸模型施加更多假設。這就進入了計量經濟學的範疇：如何施加不過分（合理）的假設，以得到一個“差不多像做實驗一樣”的識別條件，從而保證我們依然能夠將回歸結果中的“相關關係”詮釋為“因果關係”。在這個過程中，我們施加的假設，有些是可以用資料做“證據”來說明其合理性的，有些則沒有資料說話，而只能依賴經濟學邏輯分析。具體情況不同，我們挑選的假設也可以不同，所以計量經濟學家開發了適用於不同場景的豐富模型。這些計量模型，與傳統的統計學中出現的模型相比，已經走出了一條深遠的，不一樣的道路。

總結一下：為了服務不同特點的研究內容與研究目的，統計學和計量經濟學的區別由此展開。具體的區別包括：模型假設的不同、資料形式和資料假設不同（例如，很多統計學模型更強調資料正態分佈的假設，而經濟學資料大多是不符合這個假設的）、假設檢驗的理論依據不同（例如，統計學模型有一部分是有限樣本檢驗，而經濟資料通常是大樣本，檢驗時用的是大樣本近似理論）等等等等。還有很多因這些基本的不同而衍生出的許許多多區別，這就形成了兩門看上去非常相似實際上卻各自自成一脈的學科。

當然，學好兩門學科中的任意一門都有助於加深對另一門的理解和運用，前提是我們可以清晰地辨別二者的異同，並理解各種緣由。希望我的答案能對各位對這個問題的理解產生一點積極貢獻。

btw，對於有限樣本（finite sample）和大樣本（large sample）理論的區別，以及計量經濟學和統計學在運用這兩個理論時的區別，還可以多討論幾句。在傳統的統計學的OLS中，我們會注意到一個經常出現的假設：error term follows a Gaussian distribution，即誤差項是正態分佈的。與其他假設相結合，我們能得到的結論是，在對OLS模型的估計量進行單個假設檢驗的時候，檢驗統計量（testing statistics）服從一個 t 分佈。這個 t 分佈的自由度n等於樣本量的大小n，是一個精確的分佈。意思是說，對於不同資料集的不同樣本大小，這個 t 分佈對應的自由度也相應變化。當樣本量趨向於無限大時，t分佈趨向於標準正態分佈。而在統計學的假設檢驗中，我們已知具體的樣本大小n，能計算精確的統計量分佈，而t值，p值，查表值，置信區間（confidence interval）等，都是基於精確的 t(n)分佈的。

那麼，在計量經濟學中會有什麼不同呢？首先，我們丟掉正態分佈的假設，因為在絕大多數情況下，它不符合經濟資料的特徵。沒了這個假設，還能推出針對有限樣本n的統計量分佈嗎？不能了。那還可以繼續做假設檢驗嗎？可以。如何做？我們運用基於大樣本理論的假設檢驗。為什麼可以用大樣本理論？因為在經濟學研究中，資料集一般是很大的，少也有幾百，大可以到幾萬甚至更多，在這樣大的樣本下，我們可以想象，樣本量最終有機會趨向於無窮大。有了腦子裡的這個想象，我們可以用統計量近似服從（在n無窮大時）的分佈來做假設檢驗。根據大樣本理論，我們知道，標準化後的檢驗統計量近似服從一個標準正態分佈。這就是為什麼在計量經濟學中，0.05水平假設檢驗的 t 值，永遠是和1.96比較的。因為1.96是標準正態分佈的97.5%分位數，我們用它，其實是在用大樣本近似。希望這幾句補充可以給統計學和計量經濟學的區別新增一個佐證。

來源：知乎 www.zhihu.com
作者：小吉

【知乎日報】千萬使用者的選擇，做朋友圈裡的新鮮事分享大牛。點選下載

此問題還有 67 個回答，檢視全部。
延伸閱讀：
計量經濟學或者統計學證明了哪些「似乎不可能」存在的聯絡？
計量經濟學所談論的「因果」是什麼意思？

「其他文章」