国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 生育二胎对孩子教育水平的影响研究 黎煦,陶政宇 首都经济贸易大学劳动经济学院,北京100070 【摘要】二胎政策全面放开后并没有出现预期的生育高峰。已有文献主要从教育、收入、家庭、人口特 征等方面分析了生育意愿下降的原因,但是忽略了人们对生育二胎后会降低孩子教育水平的担心。为 了实证检验生育二胎对孩子教育水平的影响,本文根据CFPS基线调查数据,运用工具变量估计等方法 进行经验研究。结果表明生育二胎对个体的教育水平没有统计上的显著影响。该结论通过一系列稳健 性检验。在实证分析中通过数据重组不仅扩大了样本量,还克服了以往研究中仅包括同住同胞的局限 并且控制了同胞的结构效应。相对于已有的双胞胎、计划生育政策等工具变量,用第一胎的性别作为工 具变量,发现第一胎为女性显著增加了第n(n>2)次生育的可能性,有证据表明第一胎的性别并没有受 到人为干预的影响。从内部有效性和外部有效性两方面得出的结果更加可靠,该结论有可能在两个方 面拓展了传统的资源稀释假说。 【关键词】生育二胎;同胞数量;教育水平 【中图分类号】C92424 【文献标识码】A doi:10.16405/cnki.1004-129X.2018.06.002 【文章编号】1004-129X(2018)06-020-11 【收稿日期】2018-04-27 【基金项目】国家社会科学基金一般项目:基于人力资本的我国代际收入流动机制与公共政策研究 (14BSH023);首都经济贸易大学研究生2018年科技创新学术型项目:我国教育代际流动性的效应估 与传递机制研究一—基于经济学和社会学学科交叉的分析 【作者简介】黎煦(1973-),男,湖南岳阳人,首都经济贸易大学劳动经济学院副教授; 陶政宇(1994-),男,北京人,首都经济贸易大学劳动经济学院硕士研究生。 引言 随着我国人口结构的变化,国家对20世纪70年代末制定的计划生育政策开始做出调整。2016 年全面放开二胎政策后并没有出现预计的生育高峰,表明现在家庭的生育意愿并没有预计的那么强 烈。口学术界已经开始关注这一现象并做了深入的分析。养育成本高、社会竞争压力大是人们不愿 意生育二胎的主要原因。2一些研究进一步发现父母的教育程度、收入水平、养育观念、健康等都会 影响人们的生育意愿,父母和家庭的人口学特征对生育意愿也有显著影响,比如单独(尤其是丈夫 为独生子)、已育一女的居民二胎生育意愿强于双独和双非、已育一子的居民。这些研究为我们了 ①有学者认为,二胎政策的实施在3-5年后才会导致潜在的生育增量释放,但在初始阶段不会有太大的影响 POPULATION 20 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 生育二胎对孩子教育水平的影响研究 黎 煦,陶政宇 (首都经济贸易大学 劳动经济学院,北京 100070) 【摘 要】二胎政策全面放开后并没有出现预期的生育高峰。已有文献主要从教育、收入、家庭、人口特 征等方面分析了生育意愿下降的原因,但是忽略了人们对生育二胎后会降低孩子教育水平的担心。为 了实证检验生育二胎对孩子教育水平的影响,本文根据CFPS基线调查数据,运用工具变量估计等方法 进行经验研究。结果表明生育二胎对个体的教育水平没有统计上的显著影响。该结论通过一系列稳健 性检验。在实证分析中通过数据重组不仅扩大了样本量,还克服了以往研究中仅包括同住同胞的局限 并且控制了同胞的结构效应。相对于已有的双胞胎、计划生育政策等工具变量,用第一胎的性别作为工 具变量,发现第一胎为女性显著增加了第 n(n >2)次生育的可能性,有证据表明第一胎的性别并没有受 到人为干预的影响。从内部有效性和外部有效性两方面得出的结果更加可靠,该结论有可能在两个方 面拓展了传统的资源稀释假说。 【关键词】生育二胎;同胞数量;教育水平 【中图分类号】C924.24 【文献标识码】 A doi:10.16405/j.cnki.1004-129X.2018.06.002 【文章编号】1004-129X(2018)06-0020-11 【收稿日期】2018-04-27 【基金项目】国家社会科学基金一般项目:基于人力资本的我国代际收入流动机制与公共政策研究 (14BSH023);首都经济贸易大学研究生2018年科技创新学术型项目:我国教育代际流动性的效应估计 与传递机制研究——基于经济学和社会学学科交叉的分析 【作者简介】黎 煦(1973-),男,湖南岳阳人,首都经济贸易大学劳动经济学院副教授; 陶政宇(1994-),男,北京人,首都经济贸易大学劳动经济学院硕士研究生。 一、引言 随着我国人口结构的变化,国家对20世纪70年代末制定的计划生育政策开始做出调整。2016 年全面放开二胎政策后并没有出现预计的生育高峰,表明现在家庭的生育意愿并没有预计的那么强 烈①。[1] 学术界已经开始关注这一现象并做了深入的分析。养育成本高、社会竞争压力大是人们不愿 意生育二胎的主要原因。[2] 一些研究进一步发现父母的教育程度、收入水平、养育观念、健康等都会 影响人们的生育意愿,[3] 父母和家庭的人口学特征对生育意愿也有显著影响,比如单独(尤其是丈夫 为独生子)、已育一女的居民二胎生育意愿强于双独和双非、已育一子的居民。[4] 这些研究为我们了 ① 有学者认为,二胎政策的实施在3-5年后才会导致潜在的生育增量释放,但在初始阶段不会有太大的影响。 20
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 解影响二胎生育意愿的因素提供了有益的参考。但是这些硏究没有回答人们普遍关心的一个问题 即生育二胎对孩子的质量到底有没有影响。特别是对孩子未来的教育水平有没有影响 孩子未来的教育水平是多个投入要素的产出函数。现代人力资本理论发现,从家庭的角度来 看,除了父母的教育水平、家庭收入等要素外,家庭当中子女的数量和结构也对其教育水平有重要影 响。二者的关系如何,理论上并没有给出一个明确的解释。主流的解释是社会学中的资源稀释假 说。该假说认为,家庭资源包括非物质资源和物质资源,前者主要指父母的时间、与子女的情感交流 等,物质资源主要包括父母在子女教育上的投资和提供的学习环境。随着子女数量的增加,每个孩 子能够获得的资源就会减少,从而影响他们的教育水平。此外,群聚理论假说认为,某个特定的儿童 所处的家庭智商环境是父母和兄弟姐妹人数的平均水平,因此兄弟姐妹人数越多,对个人教育水平 的负面影响就越大。这两个理论假说都表明个人的教育水平和同胞的数量呈现出负相关关系。另 外也有其他理论假说认为家庭中子女的数量越多,父母的婚姻就越稳定,并且孩子之间可以相互帮 助等,有益于孩子的成长,从而孩子的教育水平越高。但实证研究的结果差异也很大,比如有研究发 现同胞的数量对孩子的教育水平没有影响,甚至有正向影响;有研究则发现有负面影响,对于相同 的国家,由于所用的数据和方法不同,有时得出的结论也不一致 中国的国情与其他发达国家不同。一是我国还是一个发展中国家,绝大多数家庭在对孩子进行 教育投资时会受到经济条件的约束;二是受到传统文化和经济动机的影响,父母的男孩偏好导致家 庭资源分配时偏向男孩,导致子女的数量对男孩和女孩的影响不对称;三是由于重男轻女思想的影 响,我国农村一些家庭往往牺牲第一个孩子(特别是女孩)的教育水平,要求她们给家庭提供经济支 持等。这些因素表明同胞的数量和结构都会对孩子的教育水平产生影响,从而呈现出有别于发达国 家的特点。国内外学者对我国子女数量和孩子教育水平之间的关系做了大量的实证研究。 Yao lu 等发现在我国不同时期的国家政策背景下,同胞的数量对其教育水平的影响不同,意味着国家政策 可以缓解家庭资源不足的不利影响。 Xiao lei等发现在控制了同胞的性别构成和出生顺序后,同胞 数量对孩子教育水平的影响消失,表明主要是同胞的结构而不是数量影响了孩子的教育水平。郑 磊发现子女的性别结构会影响家庭资源的内部分配,从而影响到个人的教育水平,拥有兄弟不利于 个人的教育水平,而同胞中女性比例越高越有利于个人的教育获得,这种影响对不同性别也存在不 对称性。这些研究虽然区分了子女数量和子女结构对个人教育水平的不同影响,但是没有考虑内 生性问题。由于不同家庭的父母在子女数量和质量之间的偏好不同,因此在估计中就可能存在无法 观测的“父母偏好”这一遗漏变量,从而导致估计的结果不一致。为了处理遗漏变量偏误,一般的解 决办法是用工具变量估计,现在用到的主要工具是双胞胎和计划生育政策的实施。李宏彬、张俊森 利用1990年中国人口普查1%的样本,使用第n次生育时候是否为双胞胎作为工具变量,发现孩子 的数量显著地减少了孩子的平均受教育水平。杨娟认为我国计划生育政策在70年代末开始实施 通过控制孩子的出生年份可以很好地使用计划生育政策作为工具变量,该文运用2005年1%人口抽 样调查数据和CHIP2007两套数据,估计的结果都显示子女的数量和子女受教育程度呈现出显著的 替代关系,即家庭中孩子数量越少,其接受的教育年限越多。 Nancy Qian同样使用计划生育政策作 为工具变量,发现在中国农村地区生育第二胎能提高第一个孩子的入学率。运用双胞胎或计划生 育政策作为工具变量虽然在很大程度上解决了内生性问题,但是双胞胎估计的结果只是对生育了双 胞胎的家庭有效,对没有生育双胞胎的家庭缺少外部有效性,在总体中双胞胎家庭所占的比例很小, POPULATION Page JOURNAL 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 解影响二胎生育意愿的因素提供了有益的参考。但是这些研究没有回答人们普遍关心的一个问题, 即生育二胎对孩子的质量到底有没有影响。特别是对孩子未来的教育水平有没有影响。 孩子未来的教育水平是多个投入要素的产出函数。现代人力资本理论发现,从家庭的角度来 看,除了父母的教育水平、家庭收入等要素外,家庭当中子女的数量和结构也对其教育水平有重要影 响。二者的关系如何,理论上并没有给出一个明确的解释。主流的解释是社会学中的资源稀释假 说。该假说认为,家庭资源包括非物质资源和物质资源,前者主要指父母的时间、与子女的情感交流 等,物质资源主要包括父母在子女教育上的投资和提供的学习环境。随着子女数量的增加,每个孩 子能够获得的资源就会减少,从而影响他们的教育水平。此外,群聚理论假说认为,某个特定的儿童 所处的家庭智商环境是父母和兄弟姐妹人数的平均水平,因此兄弟姐妹人数越多,对个人教育水平 的负面影响就越大。这两个理论假说都表明个人的教育水平和同胞的数量呈现出负相关关系。另 外也有其他理论假说认为家庭中子女的数量越多,父母的婚姻就越稳定,并且孩子之间可以相互帮 助等,有益于孩子的成长,从而孩子的教育水平越高。但实证研究的结果差异也很大,比如有研究发 现同胞的数量对孩子的教育水平没有影响,甚至有正向影响;[5] 有研究则发现有负面影响,对于相同 的国家,由于所用的数据和方法不同,有时得出的结论也不一致。 中国的国情与其他发达国家不同。一是我国还是一个发展中国家,绝大多数家庭在对孩子进行 教育投资时会受到经济条件的约束;二是受到传统文化和经济动机的影响,父母的男孩偏好导致家 庭资源分配时偏向男孩,导致子女的数量对男孩和女孩的影响不对称;三是由于重男轻女思想的影 响,我国农村一些家庭往往牺牲第一个孩子(特别是女孩)的教育水平,要求她们给家庭提供经济支 持等。这些因素表明同胞的数量和结构都会对孩子的教育水平产生影响,从而呈现出有别于发达国 家的特点。国内外学者对我国子女数量和孩子教育水平之间的关系做了大量的实证研究。Yao Lu 等发现在我国不同时期的国家政策背景下,同胞的数量对其教育水平的影响不同,意味着国家政策 可以缓解家庭资源不足的不利影响。[6] Xiao Lei等发现在控制了同胞的性别构成和出生顺序后,同胞 数量对孩子教育水平的影响消失,表明主要是同胞的结构而不是数量影响了孩子的教育水平。[7] 郑 磊发现子女的性别结构会影响家庭资源的内部分配,从而影响到个人的教育水平,拥有兄弟不利于 个人的教育水平,而同胞中女性比例越高越有利于个人的教育获得,这种影响对不同性别也存在不 对称性。[8] 这些研究虽然区分了子女数量和子女结构对个人教育水平的不同影响,但是没有考虑内 生性问题。由于不同家庭的父母在子女数量和质量之间的偏好不同,因此在估计中就可能存在无法 观测的“父母偏好”这一遗漏变量,从而导致估计的结果不一致。为了处理遗漏变量偏误,一般的解 决办法是用工具变量估计,现在用到的主要工具是双胞胎和计划生育政策的实施。李宏彬、张俊森 利用1990年中国人口普查1%的样本,使用第 n 次生育时候是否为双胞胎作为工具变量,发现孩子 的数量显著地减少了孩子的平均受教育水平。[9] 杨娟认为我国计划生育政策在70年代末开始实施, 通过控制孩子的出生年份可以很好地使用计划生育政策作为工具变量,该文运用2005年1%人口抽 样调查数据和CHIP2007两套数据,估计的结果都显示子女的数量和子女受教育程度呈现出显著的 替代关系,即家庭中孩子数量越少,其接受的教育年限越多。[10] Nancy Qian同样使用计划生育政策作 为工具变量,发现在中国农村地区生育第二胎能提高第一个孩子的入学率。[5] 运用双胞胎或计划生 育政策作为工具变量虽然在很大程度上解决了内生性问题,但是双胞胎估计的结果只是对生育了双 胞胎的家庭有效,对没有生育双胞胎的家庭缺少外部有效性,在总体中双胞胎家庭所占的比例很小, 21
国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 因此该估计结果很难推广到总体当中。计划生育政策作为工具变量,从有效性和外部性的角度来看 都能满足条件,但我国计划生育政策的执行在不同地区和不同年份存在较大的差异,在缺乏准确的 执行信息的情况下,使用政策实施的时间作为工具估计出的效应只是一个分配效应(T)而不是处 理效应(TOT),这也影响了我们对估计结果的解释。 本文的主旨在于从经验上回答,在二胎政策全面放开的背景下,多生育一个孩子对所有孩子的 平均教育水平有没有影响。在已有研究基础上,本文主要做了两个方面的拓展。第一,根据大量已 有文献的结论,我国父母普遍存在“重男轻女”的思想,据此本文提出一个新的工具变量,即第一胎 的性别作为工具来进行因果关系的识别。第二,在估计家庭子女数量对孩子教育水平的影响时控制 了性别结构和出生顺序,从而排除了家庭结构对教育水平的影响 、数据和变量的说明 (一)数据 本文使用的数据是CFP(2010)的基线调查数据。该数据使用多阶段概率抽样方式,覆盖了25 个省份和全国95%的人口,因此可以把它近似看作是一个接近全国总体的样本。本文使用了成人问 卷库、家庭关系库和家庭库。由于成人问卷中调查的是访谈对象的非同住同胞的信息,为了解该成 人所有同胞的信息,我们首先根据成人的母亲(或父亲)的编码和家庭关系库进行匹配,这样就找到 访谈对象完整的同胞信息。为扩大使用 表1主要变量定义(年,岁) 的样本数量,我们对匹配后的数据库进 变量定义 数值定义 行了数据重组,把一个家庭中所有的同 受访者教育年限 文盲岸半文盲=0;小学=6;初中=9 高中冲专技校/职高=12;大专=15; 胞信息都作为研究对象,这样无论是进 本科=16;硕士=19;博士=22 入了成人问卷(同住家庭成员)的子女 受访者同胞数量 1-7,包括受访者本人 还是没有进入成人问卷的子女(非同住 受访者性别 0=男;1=女 家庭成员),只要是兄弟姐妹的关系,都 受访者年龄 25-80 成为分析的样本对象。根据 Black和 受访者户口性质 0=农业户口;1=非农户口 受访者民族 0=少数民族;1=汉族 Xiao lei等学者的研究,我们假定一 受访者出生顺序 个人25岁时才最终完成教育,因此我们 同胞中性别比例 同胞中女孩占同胞数量的比例 仅保留了25岁及以上的样本。根据父 同胞中第一胎的性别0=男;1=女 母的相关信息,对调查对象的一些变量 父亲教育年限 盲岸半文盲=0;小学=6;初中=9; 的缺失值进行了填补,对于缺少关键信 高中中专技校职高=12;大专=15; 息的观测值进行了删除(见表1)。 本科=16;硕士=19;博士=22 母亲教育年限 (二)变量说明 父亲年龄 6-103 本研究的因变量是被访者的受教育 母亲年龄 32-105 年数。问卷中报告了被访者和其父母回 家庭所在地区 =东部;2=中部;3=西部 答的已完成的最高学历,我们根据该问 ① Jungmin Lee(2008)用第一胎的性别研究了韩国同胞数量对父母教育支出的影响,本文借鉴了该文的思路,首次用第一胎的 性别分析中国情景中的这个问题 POPULATION 22 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 因此该估计结果很难推广到总体当中。计划生育政策作为工具变量,从有效性和外部性的角度来看 都能满足条件,但我国计划生育政策的执行在不同地区和不同年份存在较大的差异,在缺乏准确的 执行信息的情况下,使用政策实施的时间作为工具估计出的效应只是一个分配效应(ITT)而不是处 理效应(TOT),这也影响了我们对估计结果的解释。 本文的主旨在于从经验上回答,在二胎政策全面放开的背景下,多生育一个孩子对所有孩子的 平均教育水平有没有影响。在已有研究基础上,本文主要做了两个方面的拓展。第一,根据大量已 有文献的结论,我国父母普遍存在“重男轻女”的思想,据此本文提出一个新的工具变量①,即第一胎 的性别作为工具来进行因果关系的识别。第二,在估计家庭子女数量对孩子教育水平的影响时控制 了性别结构和出生顺序,从而排除了家庭结构对教育水平的影响。 二、数据和变量的说明 (一)数据 本文使用的数据是CFPS(2010)的基线调查数据。该数据使用多阶段概率抽样方式,覆盖了25 个省份和全国95%的人口,因此可以把它近似看作是一个接近全国总体的样本。本文使用了成人问 卷库、家庭关系库和家庭库。由于成人问卷中调查的是访谈对象的非同住同胞的信息,为了解该成 人所有同胞的信息,我们首先根据成人的母亲(或父亲)的编码和家庭关系库进行匹配,这样就找到 访谈对象完整的同胞信息。为扩大使用 的样本数量,我们对匹配后的数据库进 行了数据重组,把一个家庭中所有的同 胞信息都作为研究对象,这样无论是进 入了成人问卷(同住家庭成员)的子女, 还是没有进入成人问卷的子女(非同住 家庭成员),只要是兄弟姐妹的关系,都 成为分析的样本对象。根据 Black 和 Xiao Lei等学者的研究,[7][11] 我们假定一 个人25岁时才最终完成教育,因此我们 仅保留了 25 岁及以上的样本。根据父 母的相关信息,对调查对象的一些变量 的缺失值进行了填补,对于缺少关键信 息的观测值进行了删除(见表1)。 (二)变量说明 本研究的因变量是被访者的受教育 年数。问卷中报告了被访者和其父母回 答的已完成的最高学历,我们根据该问 ① Jungmin Lee(2008)用第一胎的性别研究了韩国同胞数量对父母教育支出的影响,本文借鉴了该文的思路,首次用第一胎的 性别分析中国情景中的这个问题。 表1 主要变量定义(年,岁) 变量定义 受访者教育年限 受访者同胞数量 受访者性别 受访者年龄 受访者户口性质 受访者民族 受访者出生顺序 同胞中性别比例 同胞中第一胎的性别 父亲教育年限 母亲教育年限 父亲年龄 母亲年龄 家庭所在地区 数值定义 文盲/半文盲=0;小学=6;初中=9; 高中/中专/技校/职高=12;大专=15; 本科=16;硕士=19;博士=22 1-7,包括受访者本人 0=男;1=女 25-80 0=农业户口;1=非农户口 0=少数民族;1=汉族 1-7 同胞中女孩占同胞数量的比例 0=男;1=女 文盲/半文盲=0;小学=6;初中=9; 高中/中专/技校/职高=12;大专=15; 本科=16;硕士=19;博士=22 同上 36-103 32-105 1=东部;2=中部;3=西部 22
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 项统一换算成教育年数。 本文关注的核心自变量是同胞的数量,包括受访者本人,当受访者没有兄弟姐妹时,该变量取值 为1。控制变量包括受访者的性别、出生顺序,即当受访者是第一胎出生时取值为1,第二胎出生时 取值为2,以此类推,在回归中将该变量处理成虚拟变量,把第一胎出生作为对照组。为了使该变量 的含义明确,我们删除了双胞胎的样本。受访者的户籍分为城镇户口和农村户口,由于户籍对受访 者教育水平的影响主要是人力资本投资的早期阶段,而调查时点拥有城镇户口的部分受访者出生时 是农村户口,因此我们根据受访者3岁和12岁时的户口信息来确定受访者的户籍状况。年龄是为了 控制由于教育扩张带来的年份趋势效应;为更好地控制性别构成效应,除加人出生顺序外,还加入 个性别比例变量,该变量表示在所有的同胞中女性所占的比例。第一胎的性别是本文用到的工具变 量。除此之外,依据研究的惯例,还包括了父母的教育程度、父母的年龄和所在地区等变量(见表2)。 表2主要变量的描述性统计 全部样本(N=22191) 农村(N=18787)城镇(N=3404) 变量定义 均值标准差最小值最大值均值标准差均值标准差 受访者教育年限 6.600 4.655 0.000 22.000 5.923 10.338 3.833 受访者同胞数量 4.066 1.774 7.000 463.531 1.831 受访者性别 0.5000.000 1000 0.522 0.516 受访者年龄 49.66011.9822500080.000494881198250.61211.935 受访者年龄平方2609.70712387676250006400.00025926211237.88527040051239.572 受访者户口性质 0.360 1.000 受访者民族 1000 0.916 0.277 受访者出生顺序 2.373 1478 7.000 2.402 2.215 1425 同胞中性别比例 0.289 0.000 1500 0.324 父亲教育年限 3.517 3.870 0.00022.000 3.175 4.507 母亲教育年限 1.6373.0200.00022.0001.302 4.290 父亲年龄 690295.30336000103.000689645.19669.386 5.851 母亲年龄 69.254 6.59332.000105.000 6.54 6.847 家庭所在地区 1.8180.8161.0003.0001.8750.8261.503 0.672 第一胎是女孩(ⅣV)0.4940.5000000 0.4940.500 0.500 (三)主要变量的描述性统计 由表2可以看出,全部样本的平均年龄是50岁,最小的是25岁,最大的是80岁。其中农村户口 的样本占比是85%,城镇户口的样本占比是15%。总样本的平均受教育水平是6.6年,其中农村样本 的平均受教育水平是59年,城镇样本是10.3年,反映出我国城乡教育水平的巨大差异。受访者所在 家庭平均有4个孩子,农村户籍样本所在家庭平均有4.2个孩子,而城镇户籍样本有3.5个孩子,城镇 居民家庭的规模比农村家庭要小。表3根据户籍状况和家庭规模进一步报告了受访者教育年限的 相关信息。可以看出,二孩家庭出生的孩子的平均受教育年限要高于独生子女家庭的孩子,但随着 ①根据文盲/半文盲=0年,小学=6年,初中=9年,高中中专技校职高=12年,大专=15年,本科=16年,硕士=19年,博士=22年 进行换算。 ②删除的双胞胎样本占总样本的比重不到1%,因此不会影响估计的结果 POPULATION Page JOURNAL 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 项统一换算成教育年数①。 本文关注的核心自变量是同胞的数量,包括受访者本人,当受访者没有兄弟姐妹时,该变量取值 为1。控制变量包括受访者的性别、出生顺序,即当受访者是第一胎出生时取值为1,第二胎出生时 取值为2,以此类推,在回归中将该变量处理成虚拟变量,把第一胎出生作为对照组。为了使该变量 的含义明确,我们删除了双胞胎的样本②。受访者的户籍分为城镇户口和农村户口,由于户籍对受访 者教育水平的影响主要是人力资本投资的早期阶段,而调查时点拥有城镇户口的部分受访者出生时 是农村户口,因此我们根据受访者3岁和12岁时的户口信息来确定受访者的户籍状况。年龄是为了 控制由于教育扩张带来的年份趋势效应;为更好地控制性别构成效应,除加入出生顺序外,还加入一 个性别比例变量,该变量表示在所有的同胞中女性所占的比例。第一胎的性别是本文用到的工具变 量。除此之外,依据研究的惯例,还包括了父母的教育程度、父母的年龄和所在地区等变量(见表2)。 表2 主要变量的描述性统计 变量定义 受访者教育年限 受访者同胞数量 受访者性别 受访者年龄 受访者年龄平方 受访者户口性质 受访者民族 受访者出生顺序 同胞中性别比例 父亲教育年限 母亲教育年限 父亲年龄 母亲年龄 家庭所在地区 第一胎是女孩(IV) 全部样本(N =22 191) 均值 6.600 4.066 0.521 49.660 2 609.707 0.153 0.924 2.373 0.449 3.517 1.637 69.029 69.254 1.818 0.494 标准差 4.655 1.774 0.500 11.982 1 238.767 0.360 0.265 1.478 0.289 3.870 3.020 5.303 6.593 0.816 0.500 最小值 0.000 1.000 0.000 25.000 625.000 0.000 0.000 1.000 0.000 0.000 0.000 36.000 32.000 1.000 0.000 最大值 22.000 7.000 1.000 80.000 6 400.000 1.000 1.000 7.000 1.500 22.000 22.000 103.000 105.000 3.000 1.000 农村(N =18 787) 均值 5.923 4.163 0.522 49.488 2 592.621 — 0.916 2.402 0.446 3.175 1.302 68.964 69.169 1.875 0.494 标准差 4.466 1.746 0.500 11.982 1 237.885 — 0.277 1.485 0.282 3.640 2.591 5.196 6.542 0.826 0.500 城镇(N =3 404) 均值 10.338 3.531 0.516 50.612 2 704.005 — 0.967 2.215 0.466 5.400 3.485 69.386 69.722 1.503 0.496 标准差 3.833 1.831 0.500 11.935 1 239.572 — 0.179 1.425 0.324 4.507 4.290 5.851 6.847 0.672 0.500 (三)主要变量的描述性统计 由表2可以看出,全部样本的平均年龄是50岁,最小的是25岁,最大的是80岁。其中农村户口 的样本占比是85%,城镇户口的样本占比是15%。总样本的平均受教育水平是6.6年,其中农村样本 的平均受教育水平是5.9年,城镇样本是10.3年,反映出我国城乡教育水平的巨大差异。受访者所在 家庭平均有4个孩子,农村户籍样本所在家庭平均有4.2个孩子,而城镇户籍样本有3.5个孩子,城镇 居民家庭的规模比农村家庭要小。表3根据户籍状况和家庭规模进一步报告了受访者教育年限的 相关信息。可以看出,二孩家庭出生的孩子的平均受教育年限要高于独生子女家庭的孩子,但随着 ① 根据文盲/半文盲=0年,小学=6年,初中=9年,高中/中专/技校/职高=12年,大专=15年,本科=16年,硕士=19年,博士=22年 进行换算。 ② 删除的双胞胎样本占总样本的比重不到1%,因此不会影响估计的结果。 23
国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 同胞数量的增加,受访者的平均受教育年限逐渐减少;在各种家庭类型中,男性的平均受教育年限都 比女性高,在相同子女的家庭当中,城镇户籍人口的平均受教育年限都高于相应的农村户籍人口 农村户籍人口教育年限的性别差异要大于城镇户籍人口的教育年限的性别差异。 表3按同胞数量、户口性质划分的个体平均受教育年限 农村 城镇 同胞数量总体 女 男 女 7.946 6.427 6.610 11.275 10.307 7.547 6.963 5.885 11.881 11.517 7.924 7.432 10.379 6.159 6.820 10.103 9.428 6.600 10.641 0.054 三、模型的设定与基准估计 (一)计量模型设定 本文预计同胞的数量对教育水平产生影响,但影响的符号存在不确定性。我们根据 Black、 Nancy 等学者的研究,设定如下基准回归方程: eduyi=Bo+Brsiblingi + B2chi; +B fam; +u, 其中,edgy表示受访者的教育水平, sibling表示受访者同胞的数量(包括受访者本人),chi表 示受访者的人口学特征,包括性别、年龄、户籍、民族、出生顺序,am表示受访者的家庭背景,包括 父母的教育程度、父母的年龄、同胞中女性所占的比例、家庭所在地区等。本文关注的核心自变量是 同胞的数量,即在控制其他条件不变情况下,新增一个同胞对个体教育水平的影响。 (二)基准回归结果 表4是依据前述基准模型估计的全样本和分城乡子样本的估计结果。在总样本中,在控制了其 他因素的影响后,同胞数量变量的估计系数在1%的水平上显著为负,初步表明同胞数量对个人的教 育水平存在显著的负面影响。从控制变量的估计结果可以发现不同个体特征和家庭背景的个人在 教育水平上有明显差异。相对女性,男性的平均教育年限更高;年龄越大,平均受教育水平越低,表 明过去几十年我国的教育发展取得了明显的成绩;城镇户籍人口比农村户籍人口的教育年限平均超 过3年,反映了我国教育发展巨大的城乡地区差异;父母的教育程度越高,子女的教育年限也越高; 相比于西部地区,东部和中部地区人口的教育水平更高;出生顺序的联合F检验在1%的水平上显 著不为0,表明出生顺序对个体的教育水平有显著的影响,并且同胞中性别的比例也对受教育水平有 显著的影响,女性的比例越高,同胞的数量越多。分农村和城市样本回归的结果也表明,在两个子样 本中同胞数量的系数都为负,并且在1%的水平上显著。上述结果表明,即使控制了同胞的结构,同 胞的数量也对个体的教育水平有显著的影响,家庭中同胞的数量越多,个体的教育水平越低 四、工具变量估计和稳健性检验 (一)工具变量的有效性 上述OLS估计结果只是揭示了同胞数量和个体教育水平的相关关系,不能做因果关系方向上的 POPULATION 24 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 同胞数量的增加,受访者的平均受教育年限逐渐减少;在各种家庭类型中,男性的平均受教育年限都 比女性高,在相同子女的家庭当中,城镇户籍人口的平均受教育年限都高于相应的农村户籍人口。 农村户籍人口教育年限的性别差异要大于城镇户籍人口的教育年限的性别差异。 表3 按同胞数量、户口性质划分的个体平均受教育年限 同胞数量 1 2 3 4+ 总体 总体 7.232 7.547 7.145 6.159 6.600 男 7.946 8.167 7.924 7.219 7.536 女 6.427 6.963 6.406 5.229 5.741 农村 男 6.610 7.287 7.432 6.820 6.967 女 4.658 5.885 5.689 4.643 4.968 城镇 男 11.275 11.881 10.379 10.103 10.641 女 10.307 11.517 10.364 9.428 10.054 三、模型的设定与基准估计 (一)计量模型设定 本文预计同胞的数量对教育水平产生影响,但影响的符号存在不确定性。我们根据Black、Nancy 等学者的研究,[5][11] 设定如下基准回归方程: eduyi = β0 + β1siblingi + β2chii + β3 fami + μi 其中,eduy 表示受访者的教育水平,sibling 表示受访者同胞的数量(包括受访者本人),chi 表 示受访者的人口学特征,包括性别、年龄、户籍、民族、出生顺序,fam 表示受访者的家庭背景,包括 父母的教育程度、父母的年龄、同胞中女性所占的比例、家庭所在地区等。本文关注的核心自变量是 同胞的数量,即在控制其他条件不变情况下,新增一个同胞对个体教育水平的影响。 (二)基准回归结果 表4是依据前述基准模型估计的全样本和分城乡子样本的估计结果。在总样本中,在控制了其 他因素的影响后,同胞数量变量的估计系数在1%的水平上显著为负,初步表明同胞数量对个人的教 育水平存在显著的负面影响。从控制变量的估计结果可以发现不同个体特征和家庭背景的个人在 教育水平上有明显差异。相对女性,男性的平均教育年限更高;年龄越大,平均受教育水平越低,表 明过去几十年我国的教育发展取得了明显的成绩;城镇户籍人口比农村户籍人口的教育年限平均超 过3年,反映了我国教育发展巨大的城乡地区差异;父母的教育程度越高,子女的教育年限也越高; 相比于西部地区,东部和中部地区人口的教育水平更高;出生顺序的联合 F 检验在1%的水平上显 著不为0,表明出生顺序对个体的教育水平有显著的影响,并且同胞中性别的比例也对受教育水平有 显著的影响,女性的比例越高,同胞的数量越多。分农村和城市样本回归的结果也表明,在两个子样 本中同胞数量的系数都为负,并且在1%的水平上显著。上述结果表明,即使控制了同胞的结构,同 胞的数量也对个体的教育水平有显著的影响,家庭中同胞的数量越多,个体的教育水平越低。 四、工具变量估计和稳健性检验 (一)工具变量的有效性 上述OLS估计结果只是揭示了同胞数量和个体教育水平的相关关系,不能做因果关系方向上的 24
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 推断。已有研究发现,孩 表4同胞教育效应的OLS估计 子的数量和教育质量都是 全样本 内生的,它们都被父母喜好同胞数量(包含该子女)-0096(019)-0095-(021)0162(051) 和家庭特征影响,因此同胞性别(0=男) -2.252(0.062)-2.485(0.068)-0.807(0.151) 数量和教育获得的关系有年龄 0.028(0.020)-0.027(0.022 可能不是一种因果关系。年龄平方 0.001(0.000)-0.001”(0.000)-0.0000.000) 本文借鉴Lee的思路,根 户口性质(0=农业户口)3.288“(0.073) 民族(0=少数民族) 0.766°(0.107)0.795(0.111)0.099(0.350 据中国普遍存在的”重男轻父亲教育年限 0.186(0.008)0.202“(0.009)0.113-(0.016) 女”的思想,用第一胎的性母亲教育年限 0.93(0010)0.222“(0.013)0.173-(0017 别作为识别因果关系的工父亲年龄 0.022“(0.006)0.020“(0.007)0.036“(0.011) 具变量。主要依据是,如果母亲年龄 0.022“(0.005)0.025“(0.006)0.018(0.011) 第一胎是男孩,父母的生育家庭所在地区(西部地区为参照) 意愿较低;而第一胎如果是 东部地区 1.337(0.069)1.382“(0.073)0.483(0207) 女性,那么父母生育意愿较 中部地区 1.155(0.075)1.215“(0.080)0.290(0.217) 高,相对而言孩子的数量更出生顺序(排行第一为参照) 排行第二 0.153(0.068)-0.193“(0.075)0.119(0.159) 多。 0.048(0.081)0.026(0.088) 0.217(0.198) 在使用第一胎的性别 0.66(0.098)0.124(0.106)0.504“(0.239) 做工具变量估计之前,首先排行第 0421“(0.127)0.380(0.139)0.755-(0.299) 需要探讨工具变量的有效排行第六 0471(0.184)0.434“(0.205 1.012“(0.396) 性。一个好的工具变量应排行第七 0.214(0.237)0.189(0.255 0.277(0.576) 该是与同胞数量有高度的性别构成 0.747(0.109)0.717“(0.122)0.3850233) 相关性,但除了通过同胞数常数项 4.630(0.452)4696(0.506)8.483(1.023) 量之外,它不应该影响个体 18739 3400 的受教育水平,也就是说 0.314 0.233 0.213 合格的工具变量应该同时注:P01,P00,P001括号内为稳健标准误。 满足相关性和外生性这两个条件。 1.工具变量相关性的检验 为了检验第一胎的性别是否会影响家庭中生育孩子的数量,我们估计第一胎的性别对递进生育 的影响,即第一胎的性别是否影响第n次生育(n=2-7),报告的结果如表5所示。 可以发现,第一胎为女孩显著地提高了生育第二胎、第三胎或第四胎的概率,估计的系数分别为 0.06、0.13和0.11,分别在5%、1%、1%的水平上显著。但随着生育阶次的提高,第一胎的性别对生育 的影响逐渐减小,比如对生育第五胎的影响系数为0.06,对第六次和第七次生育的影响降至0.01,系 数也不再显著。从中可以发现,第一胎的性别除了对六孩及以上的家庭外,对其他所有不同数量子 女的家庭都有显著影响。这不仅证明了该工具变量的有效性,还可以发现受到该工具变量影响的样 本占到了总样本的绝大比例,因此在其他条件相同的情况下,用第一胎的性别作为工具变量估计的 结果可以在很大程度上代表总体的处理效应(TOT),而不仅仅是一个局部平均处理效应(LATE),这 也是该工具变量优于双胞胎和计划生育政策这两个工具变量的地方。 POPULATION Page JOURNAL 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 推断。[12] 已有研究发现,孩 子的数量和教育质量都是 内生的,它们都被父母喜好 和家庭特征影响,因此同胞 数量和教育获得的关系有 可能不是一种因果关系。[11] 本文借鉴 Lee[13] 的思路,根 据中国普遍存在的“重男轻 女”的思想,用第一胎的性 别作为识别因果关系的工 具变量。主要依据是,如果 第一胎是男孩,父母的生育 意愿较低;而第一胎如果是 女性,那么父母生育意愿较 高,相对而言孩子的数量更 多。 在使用第一胎的性别 做工具变量估计之前,首先 需要探讨工具变量的有效 性。一个好的工具变量应 该是与同胞数量有高度的 相关性,但除了通过同胞数 量之外,它不应该影响个体 的受教育水平,也就是说, 合格的工具变量应该同时 满足相关性和外生性这两个条件。 1. 工具变量相关性的检验 为了检验第一胎的性别是否会影响家庭中生育孩子的数量,我们估计第一胎的性别对递进生育 的影响,即第一胎的性别是否影响第 n 次生育(n =2-7),报告的结果如表5所示。 可以发现,第一胎为女孩显著地提高了生育第二胎、第三胎或第四胎的概率,估计的系数分别为 0.06、0.13和0.11,分别在5%、1%、1%的水平上显著。但随着生育阶次的提高,第一胎的性别对生育 的影响逐渐减小,比如对生育第五胎的影响系数为0.06,对第六次和第七次生育的影响降至0.01,系 数也不再显著。从中可以发现,第一胎的性别除了对六孩及以上的家庭外,对其他所有不同数量子 女的家庭都有显著影响。这不仅证明了该工具变量的有效性,还可以发现受到该工具变量影响的样 本占到了总样本的绝大比例,因此在其他条件相同的情况下,用第一胎的性别作为工具变量估计的 结果可以在很大程度上代表总体的处理效应(TOT),而不仅仅是一个局部平均处理效应(LATE),这 也是该工具变量优于双胞胎和计划生育政策这两个工具变量的地方。 表4 同胞教育效应的OLS估计 同胞数量(包含该子女) 性别(0=男) 年龄 年龄平方 户口性质(0=农业户口) 民族(0=少数民族) 父亲教育年限 母亲教育年限 父亲年龄 母亲年龄 家庭所在地区(西部地区为参照) 东部地区 中部地区 出生顺序(排行第一为参照) 排行第二 排行第三 排行第四 排行第五 排行第六 排行第七 性别构成 常数项 N Adj_R2 全样本 -0.096***(0.019) -2.252***(0.062) -0.028(0.020) -0.001***(0.000) 3.288***(0.073) 0.766***(0.107) 0.186***(0.008) 0.193***(0.010) 0.022***(0.006) 0.022***(0.005) 1.337***(0.069) 1.155***(0.075) -0.153**(0.068) 0.048(0.081) 0.166(* 0.098) 0.421***(0.127) 0.471**(0.184) 0.214(0.237) 0.747***(0.109) 4.630***(0.452) 22 139 0.314 农村 -0.095***(0.021) -2.485***(0.068) -0.027(0.022) -0.001***(0.000) — 0.795***(0.111) 0.202***(0.009) 0.222***(0.013) 0.020***(0.007) 0.025***(0.006) 1.382***(0.073) 1.215***(0.080) -0.193**(0.075) 0.026(0.088) 0.124(0.106) 0.380***(0.139) 0.434**(0.205) 0.189(0.255) 0.717***(0.122) 4.696***(0.506) 18 739 0.233 城镇 -0.162***(0.051) -0.807***(0.151) -0.036(0.050) -0.000(0.000) — 0.099(0.350) 0.113***(0.016) 0.173***(0.017) 0.036***(0.011) 0.018(0.011) 0.483**(0.207) 0.290(0.217) 0.119(0.159) 0.217(0.198) 0.504**(0.239) 0.755**(0.299) 1.012**(0.396) 0.277(0.576) 0.385(* 0.233) 8.483***(1.023) 3 400 0.213 注:* P <0.1,**P <0.05,***P <0.01;括号内为稳健标准误。 25
国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 表5第一胎性别对父母第n次生育(n>1)影响的 Probit估计 第二次生育第三次生育第四次生育第五次生育第六次生育第七次生育 胎女孩 0.126 0.110 0.055 0.009 (0.024) (0.023) (0.02 (0023) (0.027) (0.035 22139 13482 Pseudo r- 0.068 0.015 Log pseudo-likelihood-6.5e+03 7.le+03 -8.8e+03 8.2e+03 -6.2e+03 -3.6e+03 注:P<0.1,"P<0.05,“P<001;括号内为稳健标准误;控制变量包括父母教育程度、父母年龄、所在地区、父母 的户籍等,为简化未列出。 表6不同出生顺序的出生性别比 2.工具变量外生性的说明 全样本 工具变量的外生性无法从统计上进 出生顺序 性别比样本量性别比样本量性别比样本量行检验。我们借鉴 Angrist的做法,检验 110222622102191391.023483第一胎的性别和家庭可观测的一些特征 107194781.06167701.082708 之间的关系。我们发现第一胎的性别 1.11141540.982177 除了和母亲的年龄显著相关外(相关系 0.98120470.97105161.051531 数很小,只有-0.006),和父母的教育程 注:出生性别比表述为男性出生人数/女性出生人数。 度等家庭其他特征都不相关,这从一个 侧面印证了该工具变量的外生性。由于独生子女家庭的父母有最大的可能对第一胎的性别进行人 为干预,我们对独生子女样本单独进行了回归,发现第一胎的性别和所有的家庭特征都不相关,这个 结果进一步支持了第一胎的性别是外生性的假定①。 Xiao lei使用出生性别干预的主要技术手段B超的使用范围进一步论证了在我国特别是农村 地区进行出生性别人为干预的可能性较小,主要理由是到20世纪80年代中期,我国县城拥有B超仪 器的医院比重不过30%,大约是每90000人中才有一部B超仪器。在我们研究的样本中,最小的年 龄群体是出生于1976-1985年。年龄最小的这个群体受到出生性别干预的可能性都比较小,年龄较 大的群体就更不可能受到出生性别干预的影响了。表6根据出生顺序计算了人口出生性别比,可以 发现无论是总样本还是城市样本或农村样本,第一胎的出生性别比都在正常范围2。 (二)工具变量估计的结果 从上面对工具变量的相关性和外生性的分析可以看出,第一胎的性别是一个较好的工具变量 表7是利用第一胎的性别作为工具变量估计的结果。工具变量估计的第一阶段结果显示,第一胎的 性别对同胞数量有显著的影响,估计值为0.347,一阶段估计F值为259.29,相应的P值为00,远 超过文献中推荐的阈值水平,拒绝“存在弱工具变量”的原假设。Ⅳ估计的结果与OLS估计结果相 比,同胞数量的系数虽然为负,但在统计上已经不显著,说明在控制了遗漏变量偏误后,个体同胞数 量的多少对其平均受教育水平并没有影响。分农村和城镇两个子样本进行的ⅣV估计结果也表明同 ①由于篇幅限制,本文没有报告相关估计结果。 ②表6所用的样本量和前面分析的样本量有所不同。为了研究的需要,前面用到的样本删除了年龄小于25岁和大于80岁的 个体,为了准确计算人口出生的性别比,表6包括了所有的样本 POPULATION 26 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 表5 第一胎性别对父母第 n 次生育(n >1)影响的Probit估计 第一胎女孩 N Pseudo R2 Log pseudo - likelihood 第二次生育 0.061** (0.024) 22 139 0.040 -6.5e+03 第三次生育 0.126*** (0.023) 20 108 0.085 -7.1e+03 第四次生育 0.110*** (0.022) 17 485 0.068 -8.8e+03 第五次生育 0.055* (0.023) 13 482 0.027 -8.2e+03 第六次生育 0.009 (0.027) 9 165 0.015 -6.2e+03 第七次生育 0.012 (0.035) 5 165 0.005 -3.6e+03 注:* P <0.1,** P <0.05,*** P <0.01;括号内为稳健标准误;控制变量包括父母教育程度、父母年龄、所在地区、父母 的户籍等,为简化未列出。 2. 工具变量外生性的说明 工具变量的外生性无法从统计上进 行检验。我们借鉴Angrist的做法,检验 第一胎的性别和家庭可观测的一些特征 之间的关系。[14] 我们发现第一胎的性别 除了和母亲的年龄显著相关外(相关系 数很小,只有-0.006),和父母的教育程 度等家庭其他特征都不相关,这从一个 侧面印证了该工具变量的外生性。由于独生子女家庭的父母有最大的可能对第一胎的性别进行人 为干预,我们对独生子女样本单独进行了回归,发现第一胎的性别和所有的家庭特征都不相关,这个 结果进一步支持了第一胎的性别是外生性的假定①。 Xiao Lei[7] 使用出生性别干预的主要技术手段B超的使用范围进一步论证了在我国特别是农村 地区进行出生性别人为干预的可能性较小,主要理由是到20世纪80年代中期,我国县城拥有B超仪 器的医院比重不过30%,大约是每90 000人中才有一部B超仪器。在我们研究的样本中,最小的年 龄群体是出生于1976-1985年。年龄最小的这个群体受到出生性别干预的可能性都比较小,年龄较 大的群体就更不可能受到出生性别干预的影响了。表6根据出生顺序计算了人口出生性别比,可以 发现无论是总样本还是城市样本或农村样本,第一胎的出生性别比都在正常范围②。 (二)工具变量估计的结果 从上面对工具变量的相关性和外生性的分析可以看出,第一胎的性别是一个较好的工具变量。 表7是利用第一胎的性别作为工具变量估计的结果。工具变量估计的第一阶段结果显示,第一胎的 性别对同胞数量有显著的影响,估计值为0.347,一阶段估计 F 值为259.29,相应的 P 值为0.000,远 超过文献中推荐的阈值水平,[15] 拒绝“存在弱工具变量”的原假设。IV估计的结果与OLS估计结果相 比,同胞数量的系数虽然为负,但在统计上已经不显著,说明在控制了遗漏变量偏误后,个体同胞数 量的多少对其平均受教育水平并没有影响。分农村和城镇两个子样本进行的IV估计结果也表明同 ① 由于篇幅限制,本文没有报告相关估计结果。 ② 表6所用的样本量和前面分析的样本量有所不同。为了研究的需要,前面用到的样本删除了年龄小于25岁和大于80岁的 个体,为了准确计算人口出生的性别比,表6包括了所有的样本。 表6 不同出生顺序的出生性别比 出生顺序 1 2 3 4+ 全样本 性别比 1.02 1.07 1.09 0.98 样本量 22 622 19 478 16 331 12 047 农村 性别比 1.02 1.06 1.11 0.97 样本量 19 139 16 770 14 154 10 516 城镇 性别比 1.02 1.08 0.98 1.05 样本量 3 483 2 708 2 177 1 531 注:出生性别比表述为男性出生人数/女性出生人数。 26
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 胞数量对个体教育水平没有显著的影响。其他主要控制变量的系数和OLS估计结果相比也没有发 生明显变化 表7同胞教育效应的工具变量估计(2SLS) 全样本 农村 第一阶段第二阶段第一阶段第二阶段第一阶段第二阶段 同胞数量(包含该子女) -0.200 (0.181) (0.203) (0.384) 子女的性别(0=男) 0.297 0.288 0.319 (0.021) (0.085) (0.023 (0.093) (0.056) (0.189) 子女年龄 0.169 -0011 0.175 -0016 0.003 (0.007) (0.036) (0.008)(0.041) (0017) (0.069) 子女年龄平方 0.001-0.001 0.002 -0.001 -0.001 (0.000) (0000) (0.000) (0.001) 户口性质(0=农业户口)0.463 3.239 (0.027) (0.112) 民族(0=少数民族) 0.756 -0.103” 0.789 0.008 0.141 (0.036)(0.108) (0.038) 父亲教育年限 0.001 0.186 0.002 0.202 0.001 0.114 (0.003)(0.008) (0.003) (0.016) 母亲教育年限 -0018 0.191 -0.012 -0.018 (0.003)(0.011) (0.004)(0 (0.018) 父亲年龄 0.011 0.020 -0.007 0.035 (0.002)(0006) (0.002)(0.007) (0.011) 母亲年龄 0.013 0.024 0.013 (0.002)(0006) (0.002)(0.006) (0.013) 性别构成 0.836 -0.831 0.685 -0.8 0.243 (0.050)(0.143) (0.055) (0.161) (0.118) (0.285) 第一胎是女孩 0.347 0.337 0.404 (0.022) (0.023) (0.059) 常数项 -2.614 4.366 4.524 -2.072 7.884 (0.158) (0.178) (0.755) (0.349) (1.272) 139 3400 0.383 0.314 0.354 0.233 0.494 0.207 IVF-stat 214.349 46.283 注:P<0.1,"P<0.05,"P<0.01;括号内为稳健标准误;控制变量还包括所在地区和出生顺序,为了简化,没有列 出上述两个变量的估计结果,其结果和OIS估计相似 (三)稳健性检验 上述的工具变量估计结果表明同胞数量对个体的教育水平并没有统计上的影响。为了验证该 论的稳健性,我们对不同的子样本分别进行估计 1.根据不同出生队列人口的估计 本文使用的数据中的样本年龄在25岁到80岁之间,为了排除计划生育政策对生育的影响和教 ①我国从1979年开始倡议实行计划生育,198年正式写入宪法,1983年在全国实施。实际上,在我国部分地区1979年以前就 开始实行计划生育了,根据 Xiao Lei(2016)的建议,我们以1976年(本文中的受访者年龄34岁)作为计划生育政策开始实施的年份 POPULATION Page JOURNAL 27 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 胞数量对个体教育水平没有显著的影响。其他主要控制变量的系数和OLS估计结果相比也没有发 生明显变化。 表7 同胞教育效应的工具变量估计(2SLS) 同胞数量(包含该子女) 子女的性别(0=男) 子女年龄 子女年龄平方 户口性质(0=农业户口) 民族(0=少数民族) 父亲教育年限 母亲教育年限 父亲年龄 母亲年龄 性别构成 第一胎是女孩 常数项 N R2 IV F - stat 全样本 第一阶段 — 0.297*** (0.021) 0.169*** (0.007) -0.001*** (0.000) -0.463*** (0.027) -0.099*** (0.036) 0.001 (0.003) -0.018*** (0.003) 0.008*** (0.002) 0.013*** (0.002) -0.836*** (0.050) 0.347*** (0.022) -2.614*** (0.158) 22 139 0.383 259.293 第二阶段 -0.200 (0.181) -2.219*** (0.085) -0.011 (0.036) -0.001** (0.000) 3.239*** (0.112) 0.756*** (0.108) 0.186*** (0.008) 0.191*** (0.011) 0.023*** (0.006) 0.024*** (0.006) 0.694*** (0.143) — 4.366*** (0.640) 0.314 — 农村 第一阶段 — 0.288*** (0.023) 0.175*** (0.008) -0.002*** (0.000) — -0.103*** (0.038) 0.002 (0.003) -0.012*** (0.004) 0.011*** (0.002) 0.013*** (0.002) -0.831*** (0.055) 0.337*** (0.023) -2.896*** (0.178) 18 739 0.354 214.349 第二阶段 -0.156 (0.203) -2.466*** (0.093) -0.016 (0.041) -0.001** (0.000) — 0.789*** (0.113) 0.202*** (0.009) 0.221*** (0.013) 0.020*** (0.007) 0.025*** (0.006) 0.685*** (0.161) — 4.524*** (0.755) 0.233 — 城镇 第一阶段 — 0.319*** (0.056) 0.135*** (0.017) -0.001*** (0.000) — -0.008 (0.128) -0.001 (0.006) -0.018*** (0.006) -0.007 (0.005) 0.015*** (0.005) -0.855*** (0.118) 0.404*** (0.059) -2.072*** (0.349) 3 400 0.494 46.283 第二阶段 -0.458 (0.384) -0.705*** (0.189) 0.003 (0.069) -0.001 (0.001) — 0.141 (0.344) 0.114*** (0.016) 0.167*** (0.018) 0.035*** (0.011) 0.024* (0.013) 0.243 (0.285) — 7.884*** (1.272) 0.207 — 注:* P <0.1,**P <0.05,***P <0.01;括号内为稳健标准误;控制变量还包括所在地区和出生顺序,为了简化,没有列 出上述两个变量的估计结果,其结果和OLS估计相似。 (三)稳健性检验 上述的工具变量估计结果表明同胞数量对个体的教育水平并没有统计上的影响。为了验证该 结论的稳健性,我们对不同的子样本分别进行估计。 1. 根据不同出生队列人口的估计 本文使用的数据中的样本年龄在25岁到80岁之间,为了排除计划生育政策对生育的影响①和教 ① 我国从1979年开始倡议实行计划生育,1982年正式写入宪法,1983年在全国实施。实际上,在我国部分地区1979年以前就 开始实行计划生育了,根据Xiao Lei(2016)的建议,我们以1976年(本文中的受访者年龄34岁)作为计划生育政策开始实施的年份。 27
国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 表8不同出生队列中同胞教育效应的2SIS估计 育扩张的队列效应,我们把全样 出生队列1出生队列2出生队列3出生队列4本分为四个子样本,并对这四个 (25-34岁)(35-44岁)(45-64岁)(65-80岁)出生队列分别进行2SS估计,估 同胞数量(包含该子女)-0.4850.121 0.0650.674 计结果如表8所示。从中可以看 (0.455)(0.312)(0.272)(0.509) 出,在这四个不同的出生队列当 l1251 2686 中,我们都没有发现同胞数量影 0.438 0.319 0.285 0.176 响个体教育水平的证据。表9在 注:P01,"P00P0:括号内为稳健标准误;为简化,本表不同的出生队列下进一步把样 本分为城市样本和农村样本,得 到的结论也类似。由此可以看出,在排除了计划生育政策影响、教育扩张和其他同期外生事件的干 扰后,依然得到同样的结论。 表9分城乡不同出生队列中同胞教育效应的2SLS估计 农村 城镇 出生队列1出生队列2出生队列3出生队列4出生队列1出生队列2出生队列3出生队列4 (25-34岁)(35-44岁)(45-64岁)(65-80岁)(25-34岁)(35-44岁)(45-64岁)(65-80岁) 同胞数量0352-022401460500-19700365-0274 (包含该子女)(0485)(0.340)(0.302)(0.638)(1.375)(0.735)(0.585)(0.722) 1858 5303 2267 1940 419 0.358 0.231 0.197 0.115 0.201 0.168 0.119 0.094 2.根据不同性别人口的估计 为了考察同胞数量对男性和女性教育水平的不同影响,我们对男性样本和女性样本分别进行了 估计。表10表明,对全样本来说,同胞数量对男性教育水平没有统计上的显著影响,但对女性教育 水平有影响(在10%的水平上显著)。这可能反映了在我国还存在重男轻女的思想,兄弟姐妹的数量 主要是对女孩的教育水平有负面影响,而对男孩的教育水平则没有影响。但在农村和城市各子样本 中,除了城市样本的男性在10%的水平上显著外,其他子样本均不显著。 表10分性别的同胞教育效应的2SLS估计 全样本 农村 城镇 男性 男性 同胞数量(包含该子女) -0.188 -0.192 -1.253 (0.110) (0.315)(0.123) 11538 8955 9784 1646 0.216 0.353 0.142 0.247 0.033 0.252 3.根据母亲教育程度区分的子样本估计 表∏l是根据受访者母亲所受教育程度划分的子样本估计的同胞教育效应。同上述稳健性估计 结果类似在各类家庭中同胞数量对个体的教育水平都没有统计显著的影响。 POPULATION 28 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 育扩张的队列效应,我们把全样 本分为四个子样本,并对这四个 出生队列分别进行2SLS估计,估 计结果如表8所示。从中可以看 出,在这四个不同的出生队列当 中,我们都没有发现同胞数量影 响个体教育水平的证据。表9在 不同的出生队列下进一步把样 本分为城市样本和农村样本,得 到的结论也类似。由此可以看出,在排除了计划生育政策影响、教育扩张和其他同期外生事件的干 扰后,依然得到同样的结论。 表9 分城乡不同出生队列中同胞教育效应的2SLS估计 同胞数量 (包含该子女) N R2 农村 出生队列1 (25-34岁) -0.352 (0.485) 1 858 0.358 出生队列2 (35-44岁) -0.224 (0.340) 5 303 0.231 出生队列3 (45-64岁) 0.146 (0.302) 9 311 0.197 出生队列4 (65-80岁) -0.500 (0.638) 2 267 0.115 城镇 出生队列1 (25-34岁) -1.970 (1.375) 339 0.201 出生队列2 (35-44岁) 0.365 (0.735) 702 0.168 出生队列3 (45-64岁) -0.274 (0.585) 1 940 0.119 出生队列4 (65-80岁) -0.812 (0.722) 419 0.094 2. 根据不同性别人口的估计 为了考察同胞数量对男性和女性教育水平的不同影响,我们对男性样本和女性样本分别进行了 估计。表10表明,对全样本来说,同胞数量对男性教育水平没有统计上的显著影响,但对女性教育 水平有影响(在10%的水平上显著)。这可能反映了在我国还存在重男轻女的思想,兄弟姐妹的数量 主要是对女孩的教育水平有负面影响,而对男孩的教育水平则没有影响。但在农村和城市各子样本 中,除了城市样本的男性在10%的水平上显著外,其他子样本均不显著。 表10 分性别的同胞教育效应的2SLS估计 同胞数量(包含该子女) N R2 全样本 男性 -0.387 (0.279) 10 601 0.216 女性 -0.188* (0.110) 11 538 0.353 农村 男性 -0.230 (0.315) 8 955 0.142 女性 -0.192 (0.123) 9 784 0.247 城镇 男性 -1.253* (0.643) 1 646 0.033 女性 -0.281 (0.236) 1 754 0.252 3. 根据母亲教育程度区分的子样本估计 表11是根据受访者母亲所受教育程度划分的子样本估计的同胞教育效应。同上述稳健性估计 结果类似,在各类家庭中同胞数量对个体的教育水平都没有统计显著的影响。 表8 不同出生队列中同胞教育效应的2SLS估计 同胞数量(包含该子女) N R2 出生队列1 (25-34岁) -0.485 (0.455) 2 197 0.438 出生队列2 (35-44岁) -0.121 (0.312) 6 005 0.319 出生队列3 (45-64岁) 0.065 (0.272) 11 251 0.285 出生队列4 (65-80岁) -0.674 (0.509) 2 686 0.176 注:* P <0.1,** P <0.05,*** P <0.01;括号内为稳健标准误;为简化,本表 仅列出第二阶段估计结果,其他控制变量的估计结果未列出,下同。 28
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 表11根据母亲教育程度的同胞教育效应的2SLS估计 五、结论和建议 以下初中高中大专及以上 本文利用CFS2010年基线同胞数量(包含该子女) 0.402-0.19 -1.710 调查数据,运用第一胎的性别作 (0.186)(1.054)(1.298)(4.132) 为工具变量,发现同胞的数量对N 20814 R- 0.2720.2000.394 0.631 个体的教育水平没有统计上的显 著影响。该结论通过了一系列稳健性检验。相对于已有研究,本文的主要改进有三个方面:第一,本 文利用CFS的基线调査数据,充分利用成人库、家庭关系库和家庭库的相关信息,不仅扩大了样本 量,还包括了受访者所有同住和非同住的同胞信息,克服了以往研究中仅包括同住同胞的局限;第 已有研究发现同胞的结构,包括出生顺序、性别构成等都会对个体的教育水平产生影响,如果不 加以控制,得岀的同胞数量效应并不准确,本文在硏究中控制了同胞的结构效应;第三,本文在借鉴 国外研究成果的基础上,首次用第一胎的性别作为工具变量来分析中国的实际情况。相对于已有的 双胞胎、计划生育政策等工具变量,本文发现第一胎的性别不仅满足相关性和外生性等条件,而且我 国绝大多数家庭的生育行为都受到第一胎性别的影响,因此估计出来的结果在很大程度上可以看作 是一个处理效应,从内部有效性和外部有效性来说,该工具变量得出的结果要优于其他工具变量。 传统的资源稀释假说认为,家庭中子女的数量越多,每个孩子能够获得的经济和非经济资源就 越少,从而孩子的受教育水平就越低。本文得出的结论和传统的资源稀释假说相矛盾。一个可能的 解释是,家庭中子女的数量越多,父母(特别是母亲)外出工作的可能性越大,也就是说同胞的数量增 加了父母的劳动力供给,从而缓解了家庭资源的约束。由于本文调查的是成人样本,其父母都已退 休,无法区分他们的工作状态,因此本文无法做相应的统计分析进行验证。另外一个可能的解释是, 我国农村家庭的父母丧失劳动能力后,由于没有稳定的收入来源,一般会把子女看作有价值的经济 资源。在对孩子进行人力资本投资时,如果遇到经济约束,会以孩子未来的收入作为“抵押”进行借 贷。从中可以看出,本文得出的结论实际上是在两个方面拓展了传统的资源稀释假说:家庭的经济 资源并不是一成不变的,家庭中子女的数量越多,父母越会增加劳动力供给,从而增加家庭经济资 源;父母在对孩子进行人力资本投资时如果遇到经济约束,会以借贷的方式来缓解,从而不会影响孩 子未来的受教育水平。 本文得出的基本结论是新增一个孩子不会对所有孩子的平均教育水平产生负面影响。在当前 胎政策全面放开的条件下,生育二胎也不会影响孩子的教育水平。需要说明的是,本文研究的是 教育年限,本质上是对个体教育程度数量的测量,未来家庭资源对孩子教育的影响可能更多是教育 质量的差异,比如重点大学和非重点大学的差异等,这也是以后值得研究的方向。 【参考文献】 [1]姚引妹,李芬,尹文耀.单独两孩政策实施中堆积夫妇及其生育释放分析[J].人口研究,2014,(4):3-18 [2]马良,方行明,雷震,等.独生子女性别会影响父母的二胎生育意愿吗?—一基于中国综合社会调查(CGS)数据 的研究[J].人口学刊,2016,(6):17-26. [3]贾志科,风笑天.城市“单独夫妇”的二胎生育意愿——一基于南京、保定五类行业558名青年的调查分析[J.人口 学刊,2015,(4):5-15 [4]杨菊华.单独二孩政策下流动人口的生育意愿试析[J].中国人口科学,2015,(1):89-96,128 POPULATION Page JOURNAL 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 五、结论和建议 本文利用 CFPS 2010 年基线 调查数据,运用第一胎的性别作 为工具变量,发现同胞的数量对 个体的教育水平没有统计上的显 著影响。该结论通过了一系列稳健性检验。相对于已有研究,本文的主要改进有三个方面:第一,本 文利用CFPS的基线调查数据,充分利用成人库、家庭关系库和家庭库的相关信息,不仅扩大了样本 量,还包括了受访者所有同住和非同住的同胞信息,克服了以往研究中仅包括同住同胞的局限;第 二,已有研究发现同胞的结构,包括出生顺序、性别构成等都会对个体的教育水平产生影响,如果不 加以控制,得出的同胞数量效应并不准确,本文在研究中控制了同胞的结构效应;第三,本文在借鉴 国外研究成果的基础上,首次用第一胎的性别作为工具变量来分析中国的实际情况。相对于已有的 双胞胎、计划生育政策等工具变量,本文发现第一胎的性别不仅满足相关性和外生性等条件,而且我 国绝大多数家庭的生育行为都受到第一胎性别的影响,因此估计出来的结果在很大程度上可以看作 是一个处理效应,从内部有效性和外部有效性来说,该工具变量得出的结果要优于其他工具变量。 传统的资源稀释假说认为,家庭中子女的数量越多,每个孩子能够获得的经济和非经济资源就 越少,从而孩子的受教育水平就越低。本文得出的结论和传统的资源稀释假说相矛盾。一个可能的 解释是,家庭中子女的数量越多,父母(特别是母亲)外出工作的可能性越大,也就是说同胞的数量增 加了父母的劳动力供给,从而缓解了家庭资源的约束。[5] 由于本文调查的是成人样本,其父母都已退 休,无法区分他们的工作状态,因此本文无法做相应的统计分析进行验证。另外一个可能的解释是, 我国农村家庭的父母丧失劳动能力后,由于没有稳定的收入来源,一般会把子女看作有价值的经济 资源。在对孩子进行人力资本投资时,如果遇到经济约束,会以孩子未来的收入作为“抵押”进行借 贷。从中可以看出,本文得出的结论实际上是在两个方面拓展了传统的资源稀释假说:家庭的经济 资源并不是一成不变的,家庭中子女的数量越多,父母越会增加劳动力供给,从而增加家庭经济资 源;父母在对孩子进行人力资本投资时如果遇到经济约束,会以借贷的方式来缓解,从而不会影响孩 子未来的受教育水平。 本文得出的基本结论是新增一个孩子不会对所有孩子的平均教育水平产生负面影响。在当前 二胎政策全面放开的条件下,生育二胎也不会影响孩子的教育水平。需要说明的是,本文研究的是 教育年限,本质上是对个体教育程度数量的测量,未来家庭资源对孩子教育的影响可能更多是教育 质量的差异,比如重点大学和非重点大学的差异等,这也是以后值得研究的方向。 【参考文献】 [1]姚引妹,李芬,尹文耀. 单独两孩政策实施中堆积夫妇及其生育释放分析[J]. 人口研究,2014,(4):3-18. [2]马良,方行明,雷震,等. 独生子女性别会影响父母的二胎生育意愿吗?——基于中国综合社会调查(CGSS)数据 的研究[J].人口学刊,2016,(6):17-26. [3]贾志科,风笑天. 城市“单独夫妇”的二胎生育意愿——基于南京、保定五类行业558名青年的调查分析[J]. 人口 学刊,2015,(4):5-15. [4]杨菊华. 单独二孩政策下流动人口的生育意愿试析[J]. 中国人口科学,2015,(1):89-96,128. 表11 根据母亲教育程度的同胞教育效应的2SLS估计 同胞数量(包含该子女) N R2 小学及以下 -0.213 (0.186) 20 814 0.272 初中 0.402 (1.054) 859 0.200 高中 -0.197 (1.298) 370 0.394 大专及以上 -1.710 (4.132) 96 0.631 29