[中图分类号]F08:G40-054 [文献标识码]A [文章编号]1002-0209(2011)06-0079-12 一、引言 教育是一种最重要的人力资本投资形式,估算教育的私人收益率始终是劳动经济学和教育经济学关注的重要问题之一,对这个问题的研究也推动着微观计量经济学的发展。中国是一个以农业人口为主的发展中国家,教育对于促进农村发展和提高农民收入的重要性不言而喻。精确地估算农村居民的教育收益率,揭示教育投资对于优化农村居民就业选择、促进农村劳动力流动和增加农民收入等方面的作用,无疑具有重要的理论和现实意义。 农村居民的收入由农业收入和非农收入构成。对于农业收入,通常采用生产函数法估计教育收益率,即把农村家庭视为生产单位,把教育看作是家庭生产的一种投入要素,结合物质资本、劳动力、土地等其他投入要素,建立生产函数估算教育对于家庭农业收入(或人均农业收入)的影响。农村居民的非农收入主要是非农经营收入和工资性收入。对于非农经营收入,同样需要用生产函数的方法估计教育收益率。而对于工资性收入,通常采用明瑟收益率法估算教育收益率,这一方法基于明瑟方程,分析在控制相关变量的情况下,个体的教育水平对其工资收入的影响。估算工资性就业教育收益率的另一种方法是内部收益率法,但这一方法需要教育成本的信息(如受教育期间缴纳的学杂费、教材教辅和学习用品支出、交通费等等),相关数据很难获得,因此现有研究大部分使用明瑟收益率法。 本文基于明瑟收益率的方法估算中国农村工资性就业的教育收益率①。与以往研究相比,本研究的特色在于:其一,使用相同样本省份不同年份的微观调查数据,并采用相同的估计方法,使得估计结果在不同年份之间具有可比性;其二,考虑到农村劳动力不仅面临是否从事工资性就业的选择,也面临是否进行劳动力迁移的选择,因此使用多元选择模型纠正样本选择偏差对教育收益率估计的影响;其三,在估计时引入个体能力的代理变量来纠正遗漏能力变量造成的估计偏误。 二、文献回顾 利用明瑟方程估计我国农村地区教育收益率的研究已经取得了比较丰富的成果。在这些研究中,部分研究使用劳动者的全部收入作为因变量(如:Wei,et al.,1999;侯风云,2004;赵力涛,2006;国务院发展研究中心农村经济研究部课题组,2007)。由于农业收入、非农经营收入等非工资性收入除了受到劳动者人力资本的影响之外,还受到土地和物质资本投入等因素的影响,使用明瑟方程是不恰当的,因此在这里对这些研究的方法和结果不予讨论。 基于明瑟方程并以工资性收入为被解释变量的相关研究的总结如表1所示,这些研究在数据来源、研究对象和估算方法等方面存在不同程度的差异。 首先,从数据来源看。多数研究使用农村住户调查数据,但部分研究分别使用了城市企业调查、乡镇企业调查、城市外来人口调查、农村外出劳动力调查等不同来源的数据,有些研究甚至把不同来源的数据混合起来使用(如:姚先国、张海峰,2004)。 其次,从研究对象看。大多数研究关注全体工资收入者和外出工资收入者(即农民工),也有研究关注农村工业部门工资收入者和农村本地工资收入者。部分研究还估算了自我经营者的教育收益率(Meng,2001;王德文等,2008)②。 最后,从估算方法看,所有研究都使用了OLS估计方法。其中多数研究仅仅使用了OLS方法(李实、李文彬,1994;Gregory and Meng,1995; Parish et al.,1995; Johnson and Chow,1997; Ho et al.,2002;姚先国、张海峰,2004;谌新民、林隽宇,2009)。
但是,简单地使用OLS方法估计教育收益率会遇到很多计量方面的问题,导致教育收益率的估计是有偏和非一致的(刘泽云,2009)。其中一个常见的问题是遗漏了个体能力变量,由于个体能力与其教育水平和工资收入都相关,遗漏能力变量会导致教育收益率的OLS估计值是有偏误的,这种情况称为能力偏误。解决能力偏误问题最常用的方法是使用代理变量或工具变量。已有研究中,陈玉宇和邢春冰(2004)用户主的受教育年限作为劳动者个人能力的代理变量,其他一些研究使用父母的教育年限作为劳动者能力的代理变量或工具变量(Li and Urmanbetova,2007;王德文等,2008; de Brauw and Rozelle,2008;邓曲恒,2009)③。 另一个经常遇到的问题是样本选择偏差。研究农村工资性就业教育收益率应该使用农村住户调查数据,但有不少研究使用农村乡镇企业调查、城市企业调查或农民工调查数据,从而无法避免样本选择偏差对估计的影响。部分研究使用农村住户调查数据并用标准的Heckman两阶段模型对样本选择偏差进行了纠正,即在第一阶段使用Probit或Logit模型估计选择方程并构造逆米尔斯率,将所得的逆米尔斯率加入第二阶段的工资方程中纠正选择偏差(如:孙志军,2004;陈玉宇、邢春冰,2004;张泓骏、施晓霞,2006)④。这一方法假定农村劳动力面临工资性就业和非工资性就业的二元选择,而在现实中,农村劳动力的就业选择是多元的。因此,使用上述传统的Heckman两阶段模型无法估计不同类型工资性就业者的教育收益率。de Brauw和Rozelle(2008)考虑到了这一问题,他们把农村劳动力的就业分为农业生产、自我雇佣、本地打工和外出打工四种类型,通过扩展的样本选择偏差模型,估计出本地打工者和外出打工者的教育收益率。但他们仅仅使用了2000年的数据,无法进行跨时期的比较,也不能反映农村工资性就业教育收益率的最新状况⑤。