统计学和计量经济学有什么区别？

语言: CN / TW / HK

时间 2022-02-20 12:03:49 知乎每日精华

我是计量经济学理论方向的在读博士生，做过本科计量经济学和博士计量经济学的助教，看到这个经典的问题，也来贡献一下看法。

计量经济学和统计学的区别根源之一，在于关心的重点不同。统计学关心的是相关性（correlation），而计量经济学关心的是因果性（causality）。为什么它们关心的重点不同？因为两个学科所服务的研究主题和研究方式不同。

具体而言，统计学通常服务于可实验性更高的学科，例如生物学，医学等。而计量经济学服务于实验性不那么高的学科，例如经济学，金融学，社会学等。实验性高是指什么呢？举个例子，我们想要研究一种药物对改变某个基因表达的影响，我们可以设计一个控制变量实验来研究。“控制变量”就是实验的一个重要特征。如果实验组和对照组相比，改变的变量只有一个，那么二组在结果变量上的区别可以直接归因于这个单一的因变量。实验性高有什么好处呢？大家都知道，回归系数本身只是一个相关关系的大小，而实验性高的好处就在于，通过控制变量，收集实验数据，进行回归分析（regression），我们可以把估计出的回归参数（estimated coefficient ）直接看成因果关系的大小，因此统计学在这里不需要刻意区分相关性与因果性。然而，在社会经济类学科中，我们就很难保证实验性了。试想，我们要研究一项经济政策对人们收入的影响，难道我们能把全国人民随机分组，然后一组实行政策，另一组不实行吗？这是几乎不可能做到的。那么这个研究要如何进行下去呢？我们只能试图依赖已经观测到的经济数据来分析。相比完美的实验数据，观测到的数据不再具备“控制变量”这么好的性质（也就是有“内生性”），那怎么办呢？我们只能退而求其次，对简单的回归模型施加更多假设。这就进入了计量经济学的范畴：如何施加不过分（合理）的假设，以得到一个“差不多像做实验一样”的识别条件，从而保证我们依然能够将回归结果中的“相关关系”诠释为“因果关系”。在这个过程中，我们施加的假设，有些是可以用数据做“证据”来说明其合理性的，有些则没有数据说话，而只能依赖经济学逻辑分析。具体情况不同，我们挑选的假设也可以不同，所以计量经济学家开发了适用于不同场景的丰富模型。这些计量模型，与传统的统计学中出现的模型相比，已经走出了一条深远的，不一样的道路。

总结一下：为了服务不同特点的研究内容与研究目的，统计学和计量经济学的区别由此展开。具体的区别包括：模型假设的不同、数据形式和数据假设不同（例如，很多统计学模型更强调数据正态分布的假设，而经济学数据大多是不符合这个假设的）、假设检验的理论依据不同（例如，统计学模型有一部分是有限样本检验，而经济数据通常是大样本，检验时用的是大样本近似理论）等等等等。还有很多因这些基本的不同而衍生出的许许多多区别，这就形成了两门看上去非常相似实际上却各自自成一脉的学科。

当然，学好两门学科中的任意一门都有助于加深对另一门的理解和运用，前提是我们可以清晰地辨别二者的异同，并理解各种缘由。希望我的答案能对各位对这个问题的理解产生一点积极贡献。

btw，对于有限样本（finite sample）和大样本（large sample）理论的区别，以及计量经济学和统计学在运用这两个理论时的区别，还可以多讨论几句。在传统的统计学的OLS中，我们会注意到一个经常出现的假设：error term follows a Gaussian distribution，即误差项是正态分布的。与其他假设相结合，我们能得到的结论是，在对OLS模型的估计量进行单个假设检验的时候，检验统计量（testing statistics）服从一个 t 分布。这个 t 分布的自由度n等于样本量的大小n，是一个精确的分布。意思是说，对于不同数据集的不同样本大小，这个 t 分布对应的自由度也相应变化。当样本量趋向于无限大时，t分布趋向于标准正态分布。而在统计学的假设检验中，我们已知具体的样本大小n，能计算精确的统计量分布，而t值，p值，查表值，置信区间（confidence interval）等，都是基于精确的 t(n)分布的。

那么，在计量经济学中会有什么不同呢？首先，我们丢掉正态分布的假设，因为在绝大多数情况下，它不符合经济数据的特征。没了这个假设，还能推出针对有限样本n的统计量分布吗？不能了。那还可以继续做假设检验吗？可以。如何做？我们运用基于大样本理论的假设检验。为什么可以用大样本理论？因为在经济学研究中，数据集一般是很大的，少也有几百，大可以到几万甚至更多，在这样大的样本下，我们可以想象，样本量最终有机会趋向于无穷大。有了脑子里的这个想象，我们可以用统计量近似服从（在n无穷大时）的分布来做假设检验。根据大样本理论，我们知道，标准化后的检验统计量近似服从一个标准正态分布。这就是为什么在计量经济学中，0.05水平假设检验的 t 值，永远是和1.96比较的。因为1.96是标准正态分布的97.5%分位数，我们用它，其实是在用大样本近似。希望这几句补充可以给统计学和计量经济学的区别添加一个佐证。

来源：知乎 www.zhihu.com
作者：小吉

【知乎日报】千万用户的选择，做朋友圈里的新鲜事分享大牛。点击下载

此问题还有 67 个回答，查看全部。
延伸阅读：
计量经济学或者统计学证明了哪些「似乎不可能」存在的联系？
计量经济学所谈论的「因果」是什么意思？

「其他文章」