教育收益率对于认识教育投资规模的适宜性、收入分配公平性等问题都具有重要的意义,自从Schultz(1961)、Becker(1962)、Mincer(1974)以来,教育收益率一直是研究领域关注的热点问题。明瑟方程是研究教育收益率使用最广泛的模型,由于明瑟方程OLS回归存在一些内生性问题,可能会造成估计结果有偏,很多研究致力于克服这种内生性问题,以得到更准确的估计结果。为了克服遗漏变量、测量误差、样本自选择等造成的内生性问题,研究领域采用的估计方法有固定效应法(双胞胎数据)、工具变量法(以学费、义务教育法定年限等变化作为工具变量)、两阶段最小二乘法,代理变量法(如以智商水平代理潜在能力)、Heckman选择模型、断点回归法、得分倾向匹配法等。①由于劳动者整个生命周期的收入数据难以获得,终身收入就难以计算,以较易获得的当期收入代替终身收入,是研究领域的普遍做法。研究中国教育收益率的文献有很多②,但大多是以当期收入来进行的。然而,以当期收入代替终身收入的合理性依赖于一些很严格的假设(Heckman,et al.,2006,2008),而在现实中这些假设是很难满足的。有研究表明这种替代会造成生命周期偏误,Bhuller,et al.(2011)使用挪威几乎能够涵盖劳动者整个生命周期数据进行的研究指出,在估计教育收益率的过程中,生命周期偏误可能是比内生性偏误更严重的问题。截至目前,关于生命周期偏误的研究基本是使用发达国家的数据来进行,中国作为一个处于转型时期的发展中大国,其规律是否具有相似性,还是一个难以确定的问题。本研究将对以当期收入估计的中国教育收益率进行元分析,对其中可能存在的生命周期偏误进行评估,为相关研究领域增添来自中国的证据。此外,很多研究表明中国教育收益率存在增长趋势,而与此同时中国正面临人口老龄化趋势,本研究将对我国样本年龄情况与教育收益率估计结果的关系进行分析,对中国教育收益率的长期变动趋势进行再认识。估计结果表明,现有研究得到的我国教育收益率的变化情况,有接近30%的变化要归因于样本平均年龄的变化,也就是说,现有研究可能高估了我国教育收益率的增长幅度,大约有30%的教育收益率增长幅度可能要归因于人口年龄结构的变化。在我国人口老龄化的趋势下,样本年龄结构在不断变化,在分析我国教育收益率及教育收益率增长趋势时,生命周期偏误不可忽视。 二、文献回顾 Bj
rklund(1993)使用瑞士1951-1989年的长期面板数据对当期收入和终身收入的关系进行了分析,指出在计量分析中以当期收入替代终身收入存在潜在的问题。Haider & Solon(2006)使用扩展的变量误差模型在理论上证明,如果当期收入与终身收入的关系在整个生命周期内存在变动,使用当期收入代替终身收入进行估计就会产生生命周期偏误,并使用美国1951-1991年的长期面板数据证实了这种生命周期偏误的存在。使用不同国家的长期面板数据对扩展的变量误差模型进行了拓展的研究有:B
hlmark & Lindquist(2006)使用瑞典数据;Brenner(2010)使用德国数据;Nilsen,et al.(2010)使用挪威数据等。 Bhuller,et al.(2011)使用挪威1967-2008年数据的研究指出,在计算教育收益率的过程中,生命周期偏误可能是比内生性偏误更严重的问题。该研究对使用当期收入和终身收入估计的教育收益率进行对比分析,除了使用OLS估计方法外,还使用了另外三种估计方法以克服内生性的影响,③估计结果都验证了生命周期偏误的存在,也就是说使用现有的多种估计方法,都难以避免生命周期偏误的产生。Brunello,et al.(2012)应用欧洲9个国家长期面板数据进行的研究,对于收入水平的衡量,既使用了终身收入,也使用了首次就业收入和当前收入(对于退休者是退休时的收入),如果不存在生命周期偏误,以不同收入衡量方式估计教育收益率,估计结果应该是相近的,但是结果显示估计系数值有较大差异,说明生命周期偏误是存在的。该研究还在普通明瑟方程的OLS估计中加入了教育年限与工作经验年限的交叉项,如果不存在生命周期偏误,交叉项的估计系数应该是不显著的,但是估计结果显示交叉项显著为负。说明使用当期收入估计教育收益率在人生的不同时期结果会有差异,而以终身收入计算的教育收益率应该是稳定的,两者的差异反映了生命周期偏误的存在。 由于人口的年龄结构是在不断变化的,导致样本的年龄结构也会发生变化,在这种情况下,教育收益率的变动趋势分析可能会受到生命周期偏误的挑战。Bhuller,et al.(2011)的研究中,当使用16—64岁的样本进行回归时,教育收益率在20世纪80年代到90年代呈现出明显的上升趋势,当使用与终身收入估计结果最接近的32—33岁样本进行估计时,这种上升趋势消失了,该研究指出很多使用发达国家数据所获得的教育收益率增长趋势,可能只是生命周期偏误所造成的假象。使用当期数据所估计的中国教育收益率在20世纪80年代以后同样表现出了明显上升趋势,这些研究无一例外都是使用当期收入代替终身收入,且大多得到了教育收益率具有上升趋势的结论。④根据现有研究得到的规律,样本平均年龄越高,教育收益率的估计结果可能越高。而随着我国人口的老龄化趋势,人口和劳动者的平均年龄在持续上升。在这种情况下,教育收益率上升的趋势至少有一部分可能是由人口平均年龄的上升造成的,也就是说现有研究可能高估了中国教育收益率上升的速度。高估的程度如何是需要研究领域进一步探索的问题,本研究将使用元分析方法尝试对这一问题进行分析。 研究领域有若干关于教育收益率的元分析文献。Ashenfelter,et al.(1999)使用9个国家的27篇文献对教育收益率估计结果进行了元分析,分析了不同地区、不同时期、不同方法所估计的教育收益率的差异情况。在控制了发表偏误以后,不同估计方法所获得的估计结果差异很小。工具变量法和双胞胎数据固定影响法的发表偏误显著,而OLS估计的发表偏误不显著。基于OLS估计相对于其他估计方法在发表偏误方面的优势,本研究的元分析将以OLS回归的估计结果为主来进行。Liu&Zhang(2012)对中国教育收益率相关研究进行了元分析,旨在确定不同研究关于教育收益率估计结果的差异,在多大程度上可以归结为估计方法、样本总体、数据收集方式、变量控制情况、劳动力市场情况等方面的差异。这些关于教育收益率元分析的文献,都没有分析教育收益率估计结果与样本年龄结构的关系。Bhuller,et al.(2011)对教育收益率估计结果和样本平均年龄的关系进行了简单元分析,得出了教育收益率与样本平均年龄正相关的结论,但是该研究存在以下问题:一是只进行了简单的一元线性回归分析,没有对其他可能的影响因素进行控制,没有对发表偏误等进行分析,更没有对样本年龄结构变化情况下教育收益率的时间变化趋势进行深入分析;二是该元分析在数据采集方面不是严格按照元分析标准来进行,样本搜集范围仅局限于4篇教育收益率相关文献综述提及到的文章,元分析仅使用了来自17篇文献的17个样本,文献使用的数据主要来自欧美国家,在样本量及样本的代表性方面,都难以为认识中国的情况提供有力参考。综上所述,对以当期收入估计的中国教育收益率进行元分析,既可以为认识中国的相关情况提供依据,也可以通过详细的计量分析为相关研究领域增添新的认识。