中图分类号:F08:G40-054 文献标识码:A 文章编号:0438-0460(2012)06-0118-08 一、引言及文献回顾 教育的收入回报率,简称教育回报率,是指每增加一年或者一个阶段的教育带来收入提高的百分比。教育回报率用于衡量每增加一年或一个阶段教育对收入的影响,并因此影响劳动力是否继续接受教育的决策,从而间接影响了劳动力的整体受教育水平。我国自20世纪50年代末以来形成的城乡二元体制,使城乡发展水平、居民受教育程度形成巨大反差。随着时间的推移,城乡收入差距日益扩大,根据国家统计局公布的数据,城乡收入比已由1991年的2.40∶1扩大到2008年的3.31∶1,最近3年城乡收入比虽略有缩小,但2011年仍维持在3.13∶1的水平。除了经济发展水平、制度等方面的原因,城乡居民受教育程度的差别,亦是导致城乡收入差距拉大的重要因素。 从20世纪80年代末开始,国内外学者就已关注我国的教育回报率问题(Jamison & Gaag,1987)。21世纪以来,有关教育与收入的关系、教育回报率的变动趋势以及教育水平对收入差距的影响等问题成为教育经济学、劳动经济学领域的研究热点。从研究对象上看,这些文献大致可分为三类:一是专门研究我国农村的教育回报率,如侯风云(2004);二是专门研究我国城镇居民的教育回报率,如李实等(2003)、Li和Luo(2004);三是研究我国城乡教育回报率的差距问题,如侯风云(2005)。相对于研究城镇教育回报率的文献数量,研究城乡教育回报率差异的文献数量偏少。 在研究方法上,实证研究占据主流。教育回报率的估计大多以Mincer收入方程(Mincer,1974)为基础,采用最小二乘法(OLS)估计。为排除遗漏变量、样本选择偏差、测量误差等影响,近年来一些学者尝试使用新的方法来估计我国的教育回报率,如Li和Luo(2004)采用广义矩估计方法(GMM),李雪松、詹姆斯·赫克曼(2004)采用工具变量法(LIV),钱争鸣等(2009)采用半参数方法(SPA),高梦滔等(2006)、刘生龙(2008)则选用分位数回归方法(QR)。样本的选择也有所创新,如Li等(2012)选取双胞胎样本以消除能力、家庭条件等遗漏变量的影响。不过,相比之下,最小二乘法仍是最简便的估计方法,即使是加入适当的控制变量后,该方法的估计也是有效的。 在数据样本选择上,主要有两类。一类是利用较大规模的调查数据,这些数据基本上为全国数据,如杜两省、彭竞(2010)使用中国综合社会调查(CGSS)的数据,李雪松、詹姆斯·赫克曼(2004)使用中国城镇居民家庭收入与支出调查(CUHIES)的数据,钟甫宁、刘华(2007)使用中国家庭健康与营养调查(CHNS)的数据。另一类则使用部分省市的调查数据,如姚先国、张海峰(2004)使用4个省份的调查数据,高梦滔、姚洋(2006)使用东中西部8个省份、15年跨度的面板数据集。 在实证结果上,学者们得出不同的结论。如李实、丁赛(2003)使用1995年、1999年CHIP的调查数据,采用OLS估计,结果显示,我国城镇教育回报率1990年为2.43%,1999年为8.1%,并且高等教育的回报率大于初等教育的回报率。Li和Luo(2004)使用1995年CHIP的调查数据,采用GMM估计方法,结果显示,我国城镇居民教育回报率总体高达15%。钱争鸣、易莹莹(2009)使用1989-2006年的CHNS数据,采用SPA估计方法,结果显示,20世纪90年代后我国教育回报率呈逐年上升趋势,1991年为1.39%,2004年为5.52%,2006年为6.4%。由于估计方法、样本数据以及测度的年份不同,即使是同样研究城乡教育回报率差距的文献,所得到的结果也存在较大差异。 二、估计方法与研究思路估计教育回报率最常用的是Mincer收入方程(Mincer's earning function),该方程表示为:
估计中选择的样本为16岁以上、在劳动力市场中的样本,即排除在校学生、家务劳动者、退休人员和无劳动能力者。在变量的选择和数据处理时,被解释变量小时收入由全年所得收入除以全年工作小时数得到,其中全年所得收入为全年货币性收入与实物收入的货币折算额之和,包括第一职业和第二职业及兼职收入,工作小时数由全年工作天数乘以平均每天工作小时数得到。解释变量中,受教育年限有直接数据,城镇样本的经验年限为该样本的总工作年限,农村样本的经验年限由2003减去从事非农工作的起始年份得到。其余各变量均为控制变量,包括性别、父母收入、在校成绩、所处职位性质、单位所在产业类型等。性别变量为虚拟变量,当性别为女性时取1,用于控制由性别带来的收入差异。父母收入变量选取父母收入较高的一方,用于控制家庭条件的影响。为实现退休父母与在职父母收入的可比性,本文将样本分为退休和在职两个群体,每个群体收入在20%分位数以下的计为10,20%分位数到40%分位数之间的计为30,40%到60%间的计为50,60%到80%间计为70,80%分位数以上的计为90,再进行分析。在校成绩为虚拟变量,排名在前40%的为1,用于衡量个人能力。职位性质根据人力资本分类,分为普通员工、技术人员和管理人员。产业类型则按第一、第二、第三产业划分。