分类

谈谈计量经济学课程中回归的教学体会

  【摘要】回归是计量经济学的核心内容,由此决定了回归教学在计量经济学教学中起着关键性的作用。笔者以一元线性回归为例,根据自己的教学经验,透彻地解析了回归的本质以及如何完整地描述回归这一高度抽象的概念。


  【关键词】回归;教学;体会


  回归是计量经济学中的基本概念,在一定意义上讲,计量经济学是关于回归的学问,学好回归是学好计量经济学的关键所在。从内容上来说,回归是计量经济学的起点,也是计量经济学的核心内容,它贯穿于计量经济学的始终,学好了回归就为学好计量经济学奠定了扎实的基础。因此,回归的教学在计量经济学的教学中有着举足轻重的作用。


  回归是一个高度抽象的概念,是计量经济学教学中的一个难点,如何让学生听得懂是考验教师教学能力和教学水平的一个重要环节。笔者结合多年来的教学实践,谈谈回归教学的几点体会。笔者认为,要教好回归,应该回答以下几个问题:一是回归的本质是什么,二是如何从数学的角度对回归进行完整的描述。谈谈计量经济学课程中回归的教学体会教学改革教学改革谈谈计量经济学课程中回归的教学体会


  一、回归的本质


  回归的概念来源于生物学。生物学家高尔顿(Galton)在研究人的身高时注意到这样一个现象:在高个子人群中,下一代的平均身高会低于高个子本代的平均身高;而在矮个子人群中,下一代的平均身高则会超过本代的平均身高,也就是人的身高存在一种趋势,即向整个人群平均身高靠拢的趋势。高尔顿将变量向均值靠拢的趋势称为“回归”。


  现代意义上的回归来源于高尔顿生物学回归,但又有别于高尔顿生物学回归。共同点在于,两者都是就均值而言的,都是指向总体均值的集中趋势。而区别在于,后者只涉及一个变量,而前者则至少涉及两个变量。下面以一元线性回归为例,并以一个经典的例子进行说明。


  假设有两个变量,X为家庭可支配收入,Y为家庭消费支出。我们考察收入为Xi的家庭的消费支出(Yi)情况。在收入为Xi的所有家庭中,尽管这些家庭的收入相同,但受家庭人口数不同,消费习惯不同等因素的影响,它们的消费支出Yi并不完全相同,也就是说,尽管收入Xi给定,但相应的消费支出Yi是一个随机变量,如图1所示。然而,计量经济学家关心的不是消费支出Yi本身,而是它的条件均值E(Yi|X=Xi),简记为E(Yi|Xi)。这是因为均值有如下性质:(1)变量的均值包含了其所有变量值的信息。因为均值的计算利用了变量的所有变量值。(2)变量的均值是其所有变量值的一般代表。这是由性质(1)决定的。举例来说,欲比较两个班级某门课程的学习成绩,我们都知道只需比较这两个班级该门课程的平均成绩。为什么进行比较可以借助于平均成绩而不可以借助于最高成绩呢?原因就在于变量的均值包含了其所有变量值的信息,它可以作为各变量值的代表。而班级的最高成绩则不具有这种代表性,因为它不含其他变量值的信息。(3)变量的均值是其各变量值的合理预测值。理由是,各变量值偏离其均值的程度最低,或者说,用变量的均值来预测其各变量值所产生的误差平均起来最小。这是因为,若C≠E(Yi|Xi),则E[Yi-E(Yi|Xi)]2<E(Yi-C)2


  也就是说,对于给定的解释变量的取值Xi,如果知道了条件均值E(Yi|Xi),便可以用它来预测被解释变量Yi。条件均值E(Yi|Xi)反映了被解释变量Yi的集中趋势,抓住了这个条件均值就抓住了问题的主要矛盾,主要矛盾(E(Yi|Xi))解决了,次要矛盾(Yi)也就迎刃而解。因此,回归的本质是条件均值E(Yi|Xi)。


  二、回归概念的完整描述


  当解释变量X发生变化时,相应的条件均值E(Y|X)形成的轨迹称为总体回归线,如为直线,则称之为一元线性回归:E(Y|X)=β0+β1X。不论解释变量X如何变化,此总体回归线代表了其对应的被解释变量Y的集中趋势。知道了这条总体回归线,只要给定解释变量X的值,便可以利用它预测相应的被解释变量。因此,计量经济学的目标就是要寻找这条总体回归线。但遗憾的是,我们手头上没有总体数据,这条总体回归线是未知的,回归理论要解决的问题之一是如何利用样本数据去估计这条未知的总体回归线。


  估计总体回归线的方法有多种,传统的方法是最小二乘法,也称最小平方法(OLS),其原理是:从总体中随机抽出一个样本:(Xi,Yi),i=1,2,…,n。这n个观测对应图2中的n个点,它们来源于总体,含有总体回归线的信息,我们可以利用这n个点构建一条最佳的直线=+X,称为样本回归线,然后利用这条最佳直线去估计未知的总体回归线。现在的问题是,什么是最佳的直线?衡量最佳的标准是什么?对于最小二乘法而言,这个最佳标准是样本回归线偏离n个观测的总偏差最小。那么,用什么来衡量这一总偏差呢?人们自然会想到∑ni=1|Yi-i|。但问题是这个总偏差中含有绝对值,求这个总偏差的极小值时数学处理极不方便。但将这个绝对值直接丢掉又会导致恒为零,既不能使偏差Yi-i(也叫残差)相互抵消,又要去掉这个绝对值,一个可行的方法是平方,即用残差平方和∑ni=1(Yi-i)2来衡量总偏差。根据残差平方和最小这个准则来构建样本回归线的方法就是最小二乘法。构建样本回归线的问题就转化成了求∑ni=1(Yi-i)2=∑ni=1[Yi-(β0+β1Xi)]2的极小值问题,这个残差平方和可看成是β0和β1的二元函数,分别对这两个参数求偏导即可得到它们的估计和,从而构建出样本回归线=+X。回归理论的思路是:用样本回归线估计总体回归线,再用总体回归线预测被解释变量,即=+XE(Y|X)=β0+β1XY。用总体回归线E(Y|X)=β0+β1X预测被解释变量Y自然存在误差,此误差称为随机扰动项,记为ui=Yi-E(Yi|Xi),但此扰动项不可观测,自然会想到用残差作估计量:ei=Yi-i。由扰动项和残差分别派生出两个方程:


  Yi=β0+β1Xi+ui和Yi=+Xi+ei


  因此,要完整地描述一元线性回归的概念需要有“两线”、“两误差”和“四方程”。“两线”指的是总体回归线和样本回归线,“两误差”指的是扰动项与残差,“四方程”指的是:


  E(Y|X)=β0+β1X(1)


  =+X(2)


  Yi=β0+β1Xi+ui(3)


  Yi=+Xi+ei(4)


  其中,方程(1)是回归的本质,也是回归理论的目标。方程(2)是方程(1)的估计,二者是目标与手段的关系;方程(4)是对方程(3)的估计;方程(3)有着完整的经济学含义,即被解释变量的影响因素分为两部分:解释变量和扰动项。扰动项是计量经济学模型区别于其他模型的本质特征,在一定程度上讲,没有扰动项就没有计量经济学。扰动项好比是一个大箩筐,除了解释变量以外,影响被解释变量的因素都往里边装。


  【作者简介】


  程振源(1962-)男,江西新建人,华南师范大学经济与管理学院副教授,经济学博士,从事计量经济学和统计学的教学与科研.


  【参考文献】 

  [1]古扎拉蒂,计量经济学基础[M],中国人民大学出版社,2005. 

  [2]贾俊平等,统计学[M],中国人民大学出版社,2007. 

  [3]斯托克,计量经济学导论[M],上海财经大学出版社,2004. 

  [4]童恒庆,理论计量经济学[M],科学出版社,2005. 

上一篇:推动经济学专业课程体系的优化措施
下一篇:计量经济学课程思政的案例选择