一、前言 自1958年美国经济学家Mincer发表他的著名论文,提供了将个人收入与教育程度和工作经验联系起来的明瑟收入函数以来,很多研究者开始尝试用这一方法估算世界各地的教育投资收益率。世界银行经济学家George Psacharopoulos于1973年发表了一篇被广泛引用的文献《教育回报:一种国际比较》。国内外学者也多次利用不同数据估算中国居民的教育收益率,结果不一。其中,我国学者李实与李文彬(1994)、赖德胜(2000)、李实与丁赛(2004)分别利用了中国社科院经济研究所收入分配课题组1988年、1995年和1999年的全国统计资料估计了我国居民教育的明瑟收益率,这些研究在同类研究中较为全面和具体,也被引用得最多。刘泽云(2004)总结了20世纪80至90年代有关中国教育明瑟收益率的研究,发现大多数研究的结果在2%—6%之间,低于世界平均水平(约为10%)。在此之前,赖德胜(2000)和孙志军(2005)也分别做了很好的综述。 在城市经济改革前,中国城镇劳动力资源的配置受计划控制,存在城乡壁垒和部门分割;职工的工资和福利完全由国家决定,而且被长期冻结。在这种状况下,职工的收入与其受教育的程度关系不大,至1988年中国的教育收益率仍大大低于世界的平均水平。随着中国经济改革,尤其是伴随着企业改革,居民的教育收益率开始呈现逐年提高的趋势(李实与丁赛,2004)。在这种背景下,现有文献还关注了教育收益率在地区和各种人群中的差别问题,并做出了一些有益的探索。研究者们大多把教育收益率的提高和地区差异归因于我国劳动力市场的开放和开放的地区差异。李实与丁赛(2004)分析了教育收益率与劳动力市场分割的关系,得出了个人就业单位的所有制性质对教育收益率的影响变得越来越明显的结论。赖德胜(2000)尝试了用11个省的表征劳动力市场分割程度的合同制职工占全部职工的比重和国有工业总产值占全部工业总产值的比重,对1995年各省的教育收益率做OLS回归分析。系数的符号(正负)正如作者所预期的那样,显示各省合同制比重越高,教育收益率越高;国有工业总产值的比重越高,教育收益率越低。这些研究虽然试图解释教育收益率的差异,但是受到研究方法的限制,并且在回归分析中缺少足够的观测数,得出的结果不具有稳健性。 现有的研究大多采用OLS法,估计明瑟收入函数进而得到居民个人多受一年教育或受高一级教育的收益率。不难想象,每个地区的经济和社会变量,如劳动力市场的发育程度也会对当地居民的教育收益率产生影响,但一般而言OLS模型无法估计这种影响(详见本文第三部分)。其实处理这种既有个人变量,又有个人以上层次变量的回归问题,一般用分层线性模型(hierarchical linear model,简称HLM)。现有有关中国教育收益率的研究中仅刘泽云与萧今(2004)采用了分层线性模型方法。不过该文研究的重点是学校教育、成人教育和企业培训对职工工资及其增长的作用,而不是个人的教育收益率。另外,该文数据为1998年中国6省12市县400多家企业职工的调查样本。刘泽云与萧今(2004)分析了该样本数据存在的缺陷,如企业样本的代表性不足、因有些年份职工的工资为回忆而导致的误差、无法区分企业的行业因素和没有考虑职工的福利收入等。因此,地区的经济和社会变量,如一个地区劳动力市场的开放程度对个人教育收益率究竟有何影响,有多大的边际影响,在多大程度上可以解释教育收益率在各个地区的差异还值得进一步的探索。 在李实与李文彬(1994)、赖德胜(2000)、李实与丁赛(2004)等的基础上,本文利用分层线性模型重新估计了1995年和2002年我国城镇居民的教育收益率。本文的贡献有两点:(1)发现无论是1995年还是2002年我国城镇居民的教育收益率地区差异很大,差异主要来源于各省内部的城市之间,而以往研究所强调的省间差异并不显著;(2)第一次计算了省内城市的劳动力市场化程度对当地居民教育收益率的边际影响,得出了劳动力市场的发育确实有利于提高教育收益率的结论,而且用劳动力市场化程度的差异解释了各地教育收益率的差异。 二、数据来源和变量说明 本文数据来源于中国社会科学院经济研究所“中国城乡居民收入分配”课题组1995年和2002年两次住户抽样调查数据,其中1995年的数据与赖德胜(2000)利用的数据相同。该调查样本在国家统计局大样本内进行了二次抽样,城市样本涵盖了我国东、中、西三大地域12个省份60多个城市(包括县级市)的上万个家庭的调查数据(参见表1)。调查的主要内容是我国城市居民的收入、消费和财产分布,还记录了就业人员所属的产业部门、所有制性质和职位。个人、家庭、各地、市和各省均有编号。可以说,该调查是目前可以获得的研究中国居民收入分配最全面、最可信的微观分户资料。①
为了使个人收益率的估计更为准确,本文个人样本的选取和个人年收入的定义同李实与丁赛(2004)一致,即个人样本仅包括当年全年在职的职工,当年有过失业或下岗经历的家庭成员不包括在内。此外,个体经营者和私营企业主也不包括在内,因为他们的收入受到物形资本的影响。个人收入包括了个人从各种途径获得的货币与实物收入。 如何度量劳动力市场的发育或市场化程度对于研究教育收益率变化的问题具有关键意义。度量指标要确实能反映市场化的程度,同时取决于可获得性。在实际研究中,研究者通常用国有企业职工或合同制职工占总职工比重、国有工业占全部工业总产值的比重等指标来度量一个地区劳动力市场的开放和发育程度。这些指标基本上是宏观数据,是否能反映研究者所利用的微观数据中个体样本参与劳动力市场的程度尚大有疑问。在同类研究中,我们首次使用来源于个体样本的变量作为劳动力市场发育程度的指标。两年的样本中,有当时正就业的家庭成员如何获得现有工作的记录。1995年调查问卷中,关于如何获得现有工作的记录项有“政府安排”、“顶替”、“职业介绍所介绍”、“自己找到”和“其他”等五项,我们称除了前两项以外的方式为“通过劳动力市场谋职”,将它所占的比例定义为“通过劳动力市场谋职的比例”,并将它作为劳动力市场发育的指标之一。2002年的关于如何获得现有工作的记录更加详细,② 我们用同样的方式定义了通过劳动力市场谋职的比例。③ 同时,我们也从样本中计算国有部门职工占总职工的比重作为劳动力市场化的另一个指标。为了检验宏观数据“国有工业占全部工业总产值的比重”是否影响各地的教育收益率,我们也将1995年样本中共69个城市的这一变量作为度量指标之一。