中图分类号:G40-052.2 文献标识码:A 文章编号:1674-5485(2020)04-0025-07 DOI:10.16697/j.1674-5485.2020.04.004 随着我国教育现代化的不断推进,各地区教育人力资本得到大幅提高。我国就业人员平均受教育年限从1997年的7.30年增至2016年的10.09年,呈快速增长态势,其核密度曲线变化趋势(如图1所示)表明,我国各省域教育人力资本发展差距逐渐缩小,教育公平被促进的成果得到体现,但教育公平的实现依然任重道远。实现教育公平是一项长期的系统工程[1],它受到经济、户籍、教育代际传递等诸多因素影响。伴随“富二代”“学二代”等词汇的流行,教育代际传递越来越受到关注。
图1 1997、2001、2006、2011、2016年全国各省、市教育人力资本核密度分布 注:图中数据来源于相关年份《中国统计年鉴》 现有文献较少有直接探讨宏观层面教育人力资本对教育代际传递的影响,文献研究多集中在教育人力资本对教育不平等的影响和地区教育人力资本的公共教育支出[2]或扩招政策[3]对教育代际传递的影响等方面。而且,探讨公共教育政策等宏观因素对教育代际传递影响的研究中,学者们忽略了宏微观数据处理层次问题。本文将采用多层次回归方法克服数据处理的异质性问题,考察地区教育人力资本是否可通过促进教育代际流动而提升教育公平。 二、数据来源、模型选择与变量构造 (一)数据来源 本文数据主要来源于2014年和2016年的中国劳动力动态调查(以下简称CLDS)数据和《中国统计年鉴》,其中,CLDS数据调查周期为两年,覆盖中国29个省市(西藏、海南除外,不包括港澳台地区),以劳动力的教育、就业、劳动权益、健康和幸福感等现状和变迁为核心,同时还包含对劳动力所在家庭人口结构、家庭财产与收入、家庭消费和所在社区经济、政治等众多内容。在微观数据处理上,根据国际上对劳动年龄一般定义,保留年龄在15-64岁之间有工作或者在找寻工作的劳动力样本,并根据调查中提供的省份代码与宏观数据匹配筛选后得到全样本量为25364个,城镇和农村样本数分别为7522个和17842个。 (二)模型选择 本文首先选择OLS回归对父母受教育水平对子女受教育水平的代际影响进行初步测算,为避免只加入父母一方受教育水平而引起对子女教育代际传递程度被高估,参考Magnani E和Zhu R[12]的做法,同时将父母受教育水平作为核心解释变量引入基本模型中。构建计量模型为: edu[,i,t]=β[,0]+β[,1]faEdu[,i,t]+β[,2]moEdu[,i,t]+γX[,i,t]+μ[,i,t] (1) 式中edu[,i,t]表示第t年第i个个体的受教育水平,解释变量faEdu[,i,t]、moEdu[,i,t]分别表示父母受教育水平,X[,i,t]为其他控制变量,μ[,i,t]为微观水平上的误差项。 在式(1)的基础上引入地区教育人力资本,由于此时涉及地区宏观和个体微观两个层面数据,存在处理层次数据时的异质性问题。因此,本文增加多层次回归估计模型。基本表达式为: edu[,i,r]=β[,0,r]+β[,1,r]X[,i,r]+ε[,i,r] (2) β[,0,r]=η[,0,0]+η[,0,1]EHC[,r]+α[,0,r] (3) β[,1,r]=η[,1,0]+η[,1,1]EHC[,r]+α[,1,r] (4) 式(2)中edu[,i,r]表示地区r的第i个个体的受教育水平,X[,i,r]表示地区r的第i个个体的个人及其父母特征(性别、年龄、户籍等),式(2)和(3)中EHC[,r]表示地区r教育人力资本,α[,0,r]和α[,1,r]为宏观水平上的误差项。多层次回归模型基本思想是,同一省域中的个体变异较小,不同省域中的个体变异较大,因而不同省域中的个体特征估计系数所受的影响具有异质性,其混合模型可表示为: edu[,i,r]=η[,0,0]+η[,0,1]EHC[,r]+α[,0,r]+(η[,1,0]+η[,1,1]EHC[,r]+α[,1,r])X[,i,r]+ε[,i,r] (5) 即edu[,i,r]=η[,0,0]+η[,0,1]EHC[,r]+η[,1,0]X[,i,r]+η[,1,1]EHC[,r]X[,i,r]+(α[,0,r]+α[,1,r]X[,i,r]+ε[,i,r]) (6) 式(6)又称为协方差分解模型(Covariance Component Model,CCM),包含固定系数(η)和随机系数(α),随机系数随地区不同而变化。需要注意的是,模型不满足经典假设中误差项独立、同方差假定。因为误差项与解释变量相关,且依赖于宏观误差(α)随地区变化而变化,也依赖于个体特征变量(X[,i,r])变化而变化,故该模型不适合最小二乘法估计(OLS),本文选用迭代最大似然法进行估计。