2024-01-02
——基于15省(市)高考录取数据的实证分析原文刊载于《中国考试》2023年第11期第73—84页。作 者吴宇川,北京大学教育学院在读博士生。丁延庆,北京大学教育学院/教育经济研究所副教授,通信作者。摘 要:新高考投档方式通过缩小投档单位与录取单位之间的差异,可以释放考生的专业偏好、减少保守填报行为,并对本科专业生源质量产生影响。基于2016—2021年15省(市)的高考录取数据统计,通过双向固定效应模型分析得出3点结论:1)改革不仅提升了高偏好专业的生源质量,也提升了本科专业整体生源质量的平均水平;2)改革后不同专业生源质量的变化方向并不相同,高偏好专业相对低偏好专业在生源竞争中更具优势;3)选考科目要求相对严格的专业,其生源质量在改革中更容易受到冲击。基于上述结果,提出应加强对基础学科专业生源质量的监测与支持、设置专业选考科目要求时要平衡生源质量与学科发展之间的关系、规范高校以热带冷策略工具的使用等3方面建议。关键词:新高考;高考改革;投档方式;生源质量;平行志愿;双向固定效应模型1 问题提出 为了更加科学高效地选拔和培养人才,提升考生与高校之间的匹配度,我国的高考投档方式经历一系列变化。相较于更为传统的顺序志愿投档方式,新高考改革启动前各省(市)普遍实行的院校平行志愿投档方式被认为“缩窄”了院校录取分数范围,有效提升了考生—院校的匹配质量[1],但考生—专业的匹配问题并未得到学界的充分关注。在院校平行志愿时期,由于专业调剂规则的存在,考生可能被自己低偏好的专业录取,因此考生的专业选择自由也受到一定程度的限制[2]。随着中国高等教育从精英化阶段步入大众化、普及化阶段,人民群众对高等教育的需求早已超越“有大学可上”的低标准,考生及其家庭对自由选择专业的诉求愈发强烈。新一轮高考改革的突出亮点和目标之一就是增加考生的选择权[3],尤其是增加考生的专业选择权,这体现了国家加快推进教育高质量发展、办好人民满意教育的理念与价值追求。 根据《国务院关于深化考试招生制度改革的实施意见》提出的“改进投档录取模式,推进并完善平行志愿投档方式,增加高校和学生的双向选择机会”新要求[4],截至2023年,已经有14个省(市)的考生在新高考投档方式规则下参加了高校招生录取。新高考改革前,这些省(市)在本科招生批次均实行院校平行志愿投档,即各省(市)招生办以院校作为投档单位,将考生的电子档案依据平行志愿规则投送给高校,高校收到考生档案后再以专业作为录取单位对考生进行专业分配及录取。在该过程中,如果考生填报的专业均已录满且考生服从专业调剂,高校就会将考生调剂到尚未录满的专业。由此可知,专业调剂是投档单位与录取单位不一致的产物。新高考改革实施后,第一批新高考省(市)的投档方式转变为“专业组平行志愿”或“专业平行志愿”两种模式,前者以“专业组”为投档单位,以专业为录取单位,仍保留专业调剂规则,如北京、天津;后者将投档单位和录取单位统一为专业,不再保留调剂规则,只要符合专业报考要求,考生的投档专业和录取专业一致,如山东、辽宁。 投档方式的变化有可能改变高校的专业生源格局。新高考改革将院校拆分为若干专业组或专业进行招生,甚至取消专业调剂,这势必会降低冷门专业从校内其他专业获得高质量调剂生源的可能性。自高考改革启动以来,探讨改革对专业生源影响的研究较多。例如:有研究认为,新高考改革实施的平行志愿投档方式提高了学生的专业认同感,提升了学生的学业表现,同时也提升了高校相对强势专业的生源质量[3];还有研究认为,专业平行志愿投档造成高校内部生源质量两极分化,不同专业之间录取分数悬殊,冷门和弱势专业面临生存危机[5];有研究提出,新高考“专业导向”的投档方式能驱动高校优化专业布局、提升专业内涵、凝练专业特色[6]。 然而,上述这些论断多源于理论分析,缺乏足够的证据支持,并且对高考改革后具体专业的生源质量变化方向也未形成一致性意见。以对浙江省新高考改革前后“双一流”建设高校的录取数据进行分析为例,就存在着多种研究结论。例如:马莉萍等发现,人文、社科、经管、工学和实验班专业在改革后生源质量显著提升,而理学、农学、医学这3类专业的生源质量没有显著变化[7];卜尚聪等发现要求“必选多门”的专业生源质量在改革后有所下降[8];金红昊等研究发现医学类专业的生源质量在改革后有所提升,而材料工程类、土木工程类、能源工程类、电气工程类、机械工程类等工学专业的生源质量却出现不同程度的下滑[9];王旭辉认为优质生源主要是向医学、人文社科类的热门专业集聚[10]。从研究设计的角度分析,上述实证研究存在一定的局限性,如样本范围有限,只考察某一类高校或单一省(市),开展政策影响评估时只对比改革省(市)改革前后的生源质量,缺乏非改革省(市)的对照分析等。这些局限或许是上述各研究无法对改革后专业生源质量变化形成一致判断的重要原因。 优质生源是大学建设的重要基础,高水平大学之间的竞争始于优质生源的竞争[11]。科学评估新高考投档方式对专业生源质量的影响,可以为高校生源竞争举措提供实证依据,并对新高考改革政策调整具有一定的参考价值。鉴于此,本研究从理论和实证两个方面进行研究。理论分析主要阐释投档方式影响专业生源质量的传导机制;实证分析方面,以2016—2021年15省(市)的高考录取数据为基础,利用各省(市)改革进度差异所形成的自然实验机会,通过双向固定效应模型(two-way fixed effects model, TWFE)更加系统地考查投档方式变化对本科专业生源质量产生的具体影响。为尽可能地克服已有研究的局限,本研究将所有本科高校均纳入样本范围,不仅对比改革省(市)不同专业的生源质量变化,也有针对性地设置非改革地区的对照分析,且改革省(市)既包括实行专业平行志愿的地区,也包括实行专业组平行志愿的地区。2 理论分析与研究假设 高校的招生录取问题是经济学中典型的双边匹配问题[12-13]。在我国,每年的高考投档都关涉1000多万人的专业匹配问题,因此也被认为是当今世界上规模最大、影响最为深远的匹配实践[14]。高考投档方式影响考生的志愿填报行为,志愿填报行为影响考生—专业的匹配过程;因此,本研究认为新高考投档方式可以通过“改革→考生行为→生源质量”这一影响传导机制对本科专业生源质量产生影响。 新高考投档方式可以通过缩小投档单位与录取单位之间的差异,释放考生的专业偏好,减少考生的保守填报行为。一方面,改革释放考生的专业偏好。专业平行志愿规则将投档单位与录取单位统一为专业,考生可以直接填报高偏好专业而不用担心被调剂;专业组平行志愿虽然保留了调剂规则,但调剂范围从院校内各专业缩小至专业组内各专业,考生被调剂至低偏好专业的概率降低,因此考生的专业偏好也得到一定程度的释放。另一方面,改革减少考生的保守填报行为。改革前,考生如果要避免被调剂到低偏好专业,通常采取“保守填报专业志愿甚至院校志愿以确保专业录取”的保守策略。改革后,专业平行志愿规则下考生不会被调剂,即使是专业组平行志愿,考生也可以通过放弃填报低偏好专业所在专业组来规避低偏好专业,亦无需采取保守填报策略。总之,考生专业偏好释放、保守填报行为减少,即优先填报高偏好专业而不是低偏好专业,不仅影响考生—专业的匹配过程,而且影响专业生源质量。 参照前述已有研究思路,本研究建立考生—专业匹配模型,见图1。模型假设的4个前提条件分别为:S1、S2、S3、S4共4名考生,其高考成绩关系为s1>s2>s3>s4;某高校的两个招生专业分别为M1、M2,且每个专业招生2名;所有考生的真实专业偏好顺序均是M1优先于M2,即对所有考生而言,M1为高偏好专业,M2为低偏好专业;采用平行志愿规则进行匹配。根据上述条件可知,志愿填报存在两种可能情况。第一种,大部分考生优先填报高偏好专业,个别考生优先填报低偏好专业。如S1、S3、S4这3位考生的第一志愿是M1,第二志愿是M2,即优先填报高偏好专业;S2考生的第一志愿是M2,第二志愿是M1,即优先填报低偏好专业。按照平行志愿规则,匹配结果为S1→M1、S2→M2、S3→M1、S4→M2,且M1专业的录取分数最高为s1、最低为s3,M2专业的录取分数最高为s2,最低为s4。第二种,所有考生均优先填报高偏好专业,即S1、S2、S3、S4的第一志愿都是M1,第二志愿都是M2。按照平行志愿规则,匹配结果为S1→M1、S2→M1、S3→M2、S4→M2,且M1专业的录取分数最高为s1,最低为s2,M2专业的录取分数最高为s3,最低为s4。 对比两种志愿填报情况可知:当存在个别考生优先填报低偏好专业时,高偏好专业的录取最低分更低,低偏好专业的录取最高分更高;当考生都优先填报高偏好专业时,高偏好专业的录取最低分提升,低偏好专业的录取最高分下降。由此说明,用专业录取最低分衡量专业生源质量时,考生专业偏好释放、保守填报行为减少将会提升高偏好专业的生源质量,同时使低偏好专业的生源质量保持相对稳定,从而有助于专业整体生源质量平均水平的提升。 根据上述分析结果,提出以下3个研究假设: 假设1:新高考投档方式提升高偏好专业的生源质量。 假设2:较之低偏好专业,新高考投档方式使高偏好专业在生源竞争中更具优势。 假设3:就平均效应而言,新高考投档方式提升本科专业的生源质量。3 研究设计3.1 样本选择与数据来源 利用双向固定效应模型进行改革政策影响评估的前提是,改革与未改革省(市)的专业生源质量在改革前具有相近的变化趋势,即存在平行趋势假设。本研究在预研究中采用事件研究法进行探索性分析,以保证样本省(市)满足平行趋势假设且数量最大化。最终,以2016—2021年全国15个省(市)的高考本科专业录取面板数据(panel data)为分析基础,其中采用新高考投档方式的地区有北京、天津、山东、湖北、福建、广东、辽宁、河北、重庆,尚未实行新高考改革的地区有黑龙江、贵州、云南、江西、河南、安徽。之所以选择这些省(市),是因为在预研究时发现上述改革地区与未改革省(市)满足可比性要求。在利用自然实验进行政策影响评估时,需要划分具有可比性的实验组和对照组。为便于叙述,下文将已实行新高考投档方式的省(市)统称为“改革组”,即实验组;将尚未实行改革的省(市)统称为“未改革组”,即对照组。样本分类情况见表1。经过数据清洗与跨年匹配,最终得到覆盖14619个高校招生单位、76642个专业招生单位,5年(期)共计383210条本科专业录取数据,其中实验组数据208735条(54.5%),对照组数据174475条(45.5%)。高考录取数据主要来自各省(市)招生考试院官网及其出版的《志愿填报指南》一书,专业的学科门类划分参照《普通高等学校本科专业目录(2021年修订版)》,高校所在省(市)的经济相关数据来自国家统计局官网。3.2 模型建构与变量设计3.2.1 生源质量与可比性调整 衡量高校生源质量的方法众多,但多数实证研究以高考成绩作为衡量标准[15-18]。考虑到不同地区、年份的高考分数不具有等值性,本研究使用专业录取最低分对应的省(市)排名,即专业录取排名作为专业生源质量的衡量标准。同时,在新高考考试科目模式为“3+3”的省(市)中,其改革前区分文理科序列的排名值并不能与改革后不区分文理科的排名值直接比较,因此要对“3+3”省(市)改革前的排名数据进行可比性调整。已有研究主要采用两类调整方案,分别为单线调整方案和多线调整方案[9]。单线调整方案指根据某条既定的等值线(如本科线)对排名进行调整。如某省文理科本科线上考生总计10万,其中文科考生2万,本科线上考生总人数是文科考生人数的5倍。假设本科线附近文理科考生的生源质量相当,将文科本科线上考生的排名值乘以调整系数5,得到不区分文理的全省(市)排名。多线调整方案比较复杂:首先将改革省(市)在改革前的高考分数划分成700分及以上、600分段、500分段、400分段、400分以下5个区段,假设每条区段线附近文理科考生的生源质量相当;其次,计算文科或理科各区段的考生人数,以及各区段不区分文理科的考生总人数,将不区分文理科的考生总人数除以文科或理科考生人数作为该区段文科或理科排名的调整系数;最后,将文科或理科排名值乘以调整系数,即可得到不区分文理的排名值。以2019年北京高考分数为例,文理科600分段有考生9771人,其中文科考生1951人,文科600分段的调整系数为5.01=9771/1951。根据北京市2019年高考文科一分一段表,文科660分排名全市第122名,将122乘以调整系数5.01,即得到调整后不区分文理的排名为第611名。 本研究在基准分析中采用多线调整方案对“3+3”省(市)改革前的排名进行调整,并在稳健性检验中采用以本科线作为等值线的单线调整方案。3.2.2 模型与变量 政策影响评估要解决内生性问题,尤其要避免无法观测到的遗漏变量可能造成的评估偏误。双向固定效应模型可以通过差分形式将影响因素中不随观测单位个体和时间变化的因素剔除,是解决内生性问题的有效方法。参照吴宇川、丁延庆等研究[16,19],本研究主要采用双向固定效应模型评估新高考投档方式对专业生源质量的影响,具体模型如下。在上述模型中,i表示专业招生单位,j表示高考省(市),t表示年份。MRijt表示专业i在j省(市)t年的专业生源质量。由于不同层级高校录取排名值的绝对变化量所代表的生源质量变化程度不同,不能进行直接比较,因此要对MRijt取自然对数后再纳入模型。Refjt为“新高考投档方式”虚拟变量,是本研究关注的核心变量,标记高考省(市)j在t年的投档方式是否为专业组平行志愿或专业平行志愿(两种投档方式只需满足其一,则虚拟变量取值为1,基底为院校平行志愿)。Majorij表示专业个体的固定效应,控制专业之间无法观测且不随年份变化的固定差异;Yeart表示年份的固定效应(即招生年份的虚拟变量),控制年份之间无法观测且不随专业变化的固定差异;εijt表示随机误差。 X为一系列控制变量,具体包括:1)SRBijt与SRTijt,指专业i所属院校在j省(市)t年的院校录取最低与最高排名;2)Rehotij,t-1,指专业i在j省(市)t-1年的专业相对热度,计算公式为(院校录取最低排名-专业录取排名)/院校录取最低排名,标记专业i在所属院校所有招生专业中的相对热度;3)Numjt与Numj,t-1,指高考省(市)j在t年和t-1年的考生人数;4)Zynumjt,指高考省(市)j在t年的可填报志愿数量;5)Tier1jt与Tier2jt,指单批次和双批次虚拟变量,标记高考省(市)j在t年的本科批次设置是否为单批次或双批次,基底为三批次;6)DFMit,指双一流学科虚拟变量,标记专业i在t年是否已进入第一批“双一流”建设学科名单;7)GDPi,t-1与PCDIi,t-1,指专业i所属院校所在省(市)在t-1年的地区生产总值与人均可支配收入。 该模型本质上是对比2017至2021年改革和未改革省(市)之间专业生源质量的差别。如果Refjt的回归系数在统计学上显著,说明改革对专业生源质量产生显著影响。回归系数大于0,说明专业录取排名值增大,生源质量下降;反之,说明录取排名值减小,生源质量提升。由于模型中的MRijt取自然对数,因此核心变量回归系数的具体值表示录取排名值的变化率,β=0.01表示新高考投档方式使专业录取排名值增大1%。4 研究结果4.1 基准分析 由于专业的强弱与考生的偏好具有较强的相关性,因此本研究以相对强势、相对弱势专业分别表征高、低偏好专业进行分析检验。学科评估是教育部学位与研究生教育发展中心按照国务院学位委员会和教育部颁布的《学位授予和人才培养学科目录》,对具有博士硕士学位授予权的一级学科进行的整体水平评估[20]。虽然学科评估的对象是研究生专业,但考虑到研究生专业建设质量与本科专业建设质量具有高度一致性,本研究仍然使用具有权威性的学科评估结果对本科专业进行强弱界定。根据第四轮学科评估结果,“C+”及以上档级的专业在所有评估学科中排在前50%[20],因此本研究将“C+”及以上档级的专业界定为相对强势专业,将未参评专业界定为相对弱势专业。 表2为双向固定效应模型的回归结果,各回归均控制了相关控制变量与专业、年份固定效应,后续回归处理与此相同。回归1、2使用全部专业样本,回归3、4使用相对强势专业样本,回归5、6使用相对弱势专业样本。为了防止极端值对回归结果的干扰,回归2、4、6的样本中剔除了专业录取排名最小和最大0.1%的边缘样本。在回归1、2中,核心变量“新高考投档方式”的回归系数均显著小于0,这意味着在控制了相关控制变量及专业个体和年份的固定效应后,新高考投档方式的平均效应表现为提升本科专业的生源质量,由此说明研究假设3成立。回归3、4中核心变量的回归系数亦显著小于0,说明相对强势专业在改革后生源质量有所提升。由于相对强势专业是高偏好专业的表征,因此,可以认为新高考投档方式提升了高偏好专业的生源质量,由此说明研究假设1成立。与相对强势专业回归结果形成鲜明对比的是,回归5、6的结果显示相对弱势专业在改革后生源质量没有显著变化。考虑到相对弱势专业是低偏好专业的表征,可知较之低偏好专业,新高考投档方式更有利于高偏好专业的生源竞争,由此说明研究假设2成立。4.2 稳健性检验 为进一步检验基准分析结论的稳健性,采用更改专业生源质量衡量方法、更改可比性调整方案两种方式进行二次检验。 首先是更改生源质量衡量方法。基准分析中,因变量专业生源质量以专业录取最低分对应的省(市)排名即专业录取排名来衡量,稳健性检验1对应更改以专业相对录取排名来衡量。所谓专业相对录取排名由专业录取排名除以高考省(市)当年考生人数,反映录取排名值在该省(市)所有考生中的相对位置。相对应的,回归模型中院校录取最低与最高排名也类似处理,更改为相对指标。执行上述更改后重新对双向固定效应模型进行回归,核心变量回归系数的正负与显著性没有变化。 其次是更改可比性调整方案。在基准分析中,对“3+3”省(市)改革前的排名值以多线调整方案调整,稳健性检验2对应更改为以本科线作为等值线的单线调整方案调整。更改可比性调整方案后重新对双向固定效应模型进行回归,结果显示:全部专业样本与相对强势专业样本回归的核心变量回归系数显著小于0;相对弱势专业样本回归的核心变量回归系数不显著。 综上,两种稳健性检验的分析结果与基准分析结果一致,即与基准分析结论相同。4.3 异质性分析4.3.1 对不同学科专业生源质量的影响 考虑到部分学科门类专业样本量有限,本研究对专业的学科分类进行以下调整:1)合并哲学、文学、历史学、艺术学学科门类为“人文”学科;2)合并经济学、管理学学科门类为“经管”学科;3)单列法学类专业类为“法学类”学科,将法学学科门类下的其余专业(包括政治学类、社会学类、民族学类、马克思主义理论类、公安学类专业)与教育学学科门类合并为“其他社科”学科;4)其余专业学科分类保持不变。针对调整后的学科专业进行分样本回归,结果见表3。从表中可以看出,新高考投档方式对不同学科专业的生源质量存在异质性的影响:理学专业的生源质量因改革而降低,经管、工学、医学专业的生源质量因改革而提升,人文、法学类、其他社科、农学、实验班专业的生源质量并没有受到改革的显著影响。4.3.2 对不同专业类专业生源质量的影响 为了更加细致地考查新高考投档方式对特定专业类专业生源质量的异质性影响,对不同专业类分样本进行探索性分析,结果见表4。 表4呈现了部分具有代表性的回归结果,大致可以分为两类。第一类为高偏好专业类,如回归16~22中的公共卫生与预防医学类、建筑类、航空航天类、临床医学类等,这些专业类的专业生源质量有所提升,且提升的幅度超过所属学科的平均水平。第二类为低偏好专业类或传统专业类,如数学类、物理学类、化学类、交通运输类、纺织类专业等,其中部分专业类所属学科在改革后整体生源质量有所提升,但其专业生源质量并没有显著提升,甚至受改革影响而有所下降。可见,不论改革产生何种方向的影响,高偏好专业在生源竞争中总是处于相对优势地位,而一些低偏好专业、传统专业即使在整体利好的政策环境中也无法改变竞争弱势的境况。上述回归结果在一定程度上证明研究假设2成立。4.3.3 对不同选科要求下专业生源质量的影响 新高考改革前,在“3+文综/理综”的考试科目模式下,专业的选科要求或者全文、全理,或者不限选科。新高考改革后,专业选科要求更加多元,可分为不限选科、必选一门、必选多门。为了考察改革对不同选科要求下专业生源质量的异质性影响,本研究对不同选科要求的专业进行分样本回归。 表5中回归30~32为不限选科、必选一门、必选多门三类选科要求专业的回归结果。从回归结果可以看出,新高考投档方式可以提升选科要求为不限选科或必选一门的专业的生源质量,但选科要求为必选多门的专业,其生源质量有所下降。进一步分析特定选科要求专业生源质量受改革的影响。回归33~35为须选物理专业的回归结果,其中:回归33的系数不显著,说明对于要求选考物理的专业,改革的平均效应表现为对其生源质量没有显著影响;回归34的结果说明选科要求为必选一门且必选为物理的专业,生源质量因改革而有所提升;回归35的结果说明选科要求为必选多门且必选包括物理的专业,生源质量因改革而有所下降。回归36~38为须选化学的专业的回归结果。对于要求选考化学的专业,改革的平均效应表现为降低其生源质量;选科要求为必选一门且必选为化学的专业,生源质量并未因改革而有显著变化;选科要求为必选多门且必选包括化学的专业,生源质量会因改革而有所下降。从回归34、35、37、38的结果可知,不论必选物理还是化学,“必选多门”类专业的生源质量在投档方式变化后下降。由此说明,选考科目要求相对更加严格的专业,其生源质量更易在改革中受到冲击。5 结论与建议 本研究以2016—2021年15省(市)的高考录取数据为基础,利用各省(市)改革进度差异所形成的自然实验机会,通过双向固定效应模型分析更加系统地考察投档方式变化对本科专业生源质量所产生的影响。5.1 研究结论 第一,新高考投档方式不仅提升了高偏好专业的生源质量,也提升了本科专业整体生源质量的平均水平。事实上,在高招录取分省(市)定额的制度下,如果没有大规模的扩招或缩招,专业生源竞争是零和博弈,不可能所有专业的生源质量均有所提升。根据本研究建立的考生—专业匹配模型可知,考生专业偏好释放、保守填报行为减少不仅可以提升高偏好专业的生源质量,还可以使低偏好专业的生源质量保持相对稳定,因此可以使专业整体生源质量的平均水平上升。在这一过程中,低偏好专业的录取最高分下降,这意味着投档方式变化对高偏好专业的利好是以牺牲低偏好专业的生源为代价,因此仍然是零和博弈。 第二,改革后不同专业生源质量的变化方向并不相同,高偏好专业在生源竞争中更具优势。本研究分析发现,相对强势的专业在改革后生源质量有所提升,而相对弱势专业的生源质量没有显著变化;经管、工学、医学专业的生源质量因改革而提升,理学专业的生源质量有所降低,人文、法学类、其他社科、农学、实验班专业的生源质量没有显著变化;公共卫生与预防医学类、建筑类、航空航天类、临床医学类等高偏好专业的生源质量有所提升,且提升幅度超过所属学科的平均水平;而数学类、物理学类、化学类、交通运输类、纺织类等专业的生源质量不仅没有显著提升,甚至受改革影响而有所下降。 第三,选考科目要求相对更严格的专业,其生源质量更容易在改革中受到冲击。改革之初,教育行政主管部门为了鼓励高校发挥招生自主权,并未对专业的选科要求作详细、严格的限定。但在改革实践中,由于担心考生会优先选择选科要求较宽松的专业,从而导致选科要求严格的专业生源数量、质量下降[21-22],一些高校因此故意降低计划招生专业的选科要求,甚至不作任何限制[23-24],尤其是那些缺乏“名校”光环的高校,即使希望科学设置选科要求,也可能出于规避招生风险的考虑而被动采取跟随策略。本研究通过实证分析证实,严格选考科目要求的确会造成专业生源质量的下降,因此高校的顾虑也并非杞人忧天。5.2 专业发展建议 首先,应加强基础学科专业生源质量的监测与支持。本研究发现,数学类、物理学类、化学类等基础学科专业的生源质量受改革影响而有所下降。基于发达国家的实证研究可知,数理等基础学科专业在人力资本积累上较其他专业具有更高的正外部性,对促进经济增长与创新具有重要意义[25-26]。这类专业生源质量的持续下滑必将给国家的教育、人才与科技发展战略带来消极影响,因此,要在生源质量监测的基础上予以必要的政策支持。例如,政府可以通过强基计划、基础学科拔尖学生培养计划、“双一流”建设等政策对重点学科专业予以资源倾斜;同时在政策上引导高校分类发展,完善专业的评价、整改、退出机制,将国家、社会急需的专业办精办好。高校也需要加强专业布局调整与专业建设,主动与高中合作,向高中生普及更多的专业背景知识,辅助他们做好专业与职业规划,避免在志愿填报时盲目追求所谓的热门专业[27]。 其次,高校在设置专业的选考科目要求时,要平衡生源质量与学科发展之间的关系。目前,教育部印发的《普通高校本科招生专业选考科目要求指引》已经更新至第三版,意在引导高校设置合理的选科要求,在政策允许范围内平衡生源质量与学科发展之间的关系。对高校而言,无论选择哪些学科作为招生专业的选考科目要求,权衡取舍的前提与关键是切实论证招生专业的必要学科素养。本研究通过实证分析发现,新高考投档方式可以提升“不限选科或必选一门”的专业生源质量,但“必选多门”尤其是必选科目中包含物理或化学的专业生源质量会有所下降。因此,从招生录取策略角度分析,“必选一门”的方式是较好的选择,因为它在保证专业生源拥有必要学科素养的同时,还可以保证生源质量不会受到显著的消极影响。 最后,国家教育行政主管部门应进一步规范高校以热带冷策略工具的使用。高校为了保护冷门、弱势等低偏好专业的生源,在新高考投档规则的框架内常以大类招生的方式将冷热门专业“捆绑销售”。例如部分高校以实验班、精英班等大类专业作为招生噱头,将冷热门专业简单拼凑合并招生,行策略招生之举而无大类培养之实[28]。事实上,通过赋予考生更多的选择权,倒逼高校重视学科建设与专业结构优化本是新高考改革的初衷,但以热带冷策略工具的过度使用却极大浪费了国家的政策资源,提高了改革成本。因此,国家教育行政主管部门亟须出台相关指引文件,规范高校的大类招生行为,厘清高校自主权的边界,让相关规则的应用回归初心。 参考文献:(略)(免责声明:本文转载于《中国考试》,文章观点与本栏目无关,如涉侵权,联系立删!)
2023-12-20
原文刊载于《中国考试》2023年第11期第85—94页。作 者杨莉,清华大学教育研究院在读博士生。 摘 要:我国目前已基本实现义务教育有保障的目标,但仍然存在教育结果不公平的问题。基于中国教育追踪调查2013-2014学年的基线数据,分析家庭社会经济地位对初中生学业成绩的影响,以及父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望这4类家庭非货币性资源投入在两者之间的中介作用。研究发现:家庭社会经济地位能够显著正向预测初中生的学业成绩;4类家庭非货币性资源投入在两者间均发挥部分中介作用,能够降低家庭社会经济地位差距造成的初中生学业成绩差异。本研究可为初中阶段教育公平相关政策的制订提供参考依据,以期推动我国初中后阶段教育公平目标的实现。关键词:家庭社会经济地位;初中生学业成绩;家庭非货币性资源投入;考试公平1 问题提出 2010年,中共中央、国务院印发《国家中长期教育改革和发展规划纲要(2010—2020)》,明确提出“形成惠及全民的公平教育”的战略目标[1]。截至2019年底,全国99.8%的义务教育学校(含教学点)的办学条件已达到基本要求[2]。根据国务院新闻办公室2021年8月印发的《全面建成小康社会:中国人权事业发展的光辉篇章》白皮书,农村贫困家庭子女义务教育阶段辍学问题已实现动态清零[3]。 2020年,我国已基本实现义务教育有保障的目标[4],但教育结果不公平的现象仍然存在,且主要表现在家庭背景等先赋性因素对学生学业成绩及教育机会获得的显著影响[5-6]。相较于高中及高中后教育阶段,初中阶段学业成绩与家庭背景的关系更值得探讨。这主要有3方面原因:其一,在我国现行招生考试制度下,无论是中考还是高考,考试分数都是后一阶段教育机会和教育质量的重要影响因素;其二,学业成绩具有累积性特征,义务教育阶段的学业成绩能够显著预测中考与高考成绩,高等教育阶段的不平等通常是初中升高中阶段不平等的延续[7];其三,随着教育阶段的上升,家庭社会经济地位、家庭文化背景对教育获得的影响逐渐减弱,有研究提出家庭因素对中考阶段的影响大于高考阶段[8]。在这一社会背景下,研究家庭背景等先赋性因素对初中生学业成绩的影响及其作用机制,其结论不仅可以促进初中阶段的教育公平,甚至能够为优化教育全局环境提供参考。 家庭背景主要通过增加对子女的货币性与非货币性资源投入这两条路径影响学生学业成绩[9],其中,非货币性资源投入的可塑性更强,更应获得学者与政策制定者的关注。具体而言,高家庭货币性资源投入表现为,为孩子购置更好的学习产品、通过购买学区房等方式让孩子进入条件更好的学校等。家庭对子女的货币性资源投入力度受到家庭经济条件的约束,不同家庭经济背景学生所获得的该投入差异悬殊。高家庭非货币性资源投入表现为,为孩子付出更多时间、为子女提供情感支持、对子女具有较高教育期望、采取更合理的养育方式等。有研究发现,虽然家庭社会经济地位是预测父母对子女教育投资的重要因素,但养育子女的方式并不完全取决于这种地位,父母的价值观更能决定他们对子女教育的参与[10]。另一项研究结果表明,与货币性资源相比,非货币性资源对中国儿童的成就影响更大,而且与家庭财富或收入不显著相关[9]。因此,基于非货币性资源投入视角的相关研究发现对制订促进教育公平的政策可能更有参考意义。基于此,本研究主要关注家庭社会经济地位、家庭非货币性资源投入与学业成绩三者之间的关系,并试图回答以下两个问题:1)家庭社会经济地位对初中生学业成绩的影响如何;2)各类家庭非货币性资源投入能否在家庭社会经济地位与初中生学业成绩间发挥一定的中介作用。2 文献综述2.1 家庭背景对学业成绩的直接影响 关于家庭背景对学业成绩影响的研究,可追溯到美国社会学家Coleman等于1966年发布的《教育机会均等》(Equality of Educational Opportunity)报告。该研究发现,在排除很多其他家庭因素的情况下,仅是父母受教育程度、家庭拥有物、父母对子女的教育期望等家庭层面的因素就已经能够解释子女学业成绩10%~25%的变异[11]。这一结论引起了研究者对家庭层面因素的广泛关注。此后,一系列实证研究支持了Coleman的结论,并进一步探究了其他家庭背景因素对成绩的影响。浦小松分析我国14418名中学生样本发现,父母受教育程度对子女成绩的正向影响显著,父母从事职业类型对子女成绩的影响较小[12]。李佳丽和何瑞珠基于中国教育追踪调查(China Education Panel Survey, CEPS)2013-2015年追踪数据的研究发现,经济状况好、父母职业地位以及父母受教育水平高的家庭的子女,其语文、数学、外语3科平均成绩显著高于弱势家庭子女,例如,富裕家庭子女的平均成绩比困难家庭子女高出10分左右[13]。Dahl和Lochner分析了美国青少年纵向调查数据库的4500名儿童和母亲的配对数据,发现家庭收入每增加1000美元,子女数学成绩与阅读成绩合计将提高标准差的6%[14]。除上述显著影响学业成绩的家庭层面变量之外,家庭社会经济地位这一衡量家庭背景的综合指标也对学生成绩具有显著影响。已有研究发现,家庭社会经济地位越高的学生,其学业成绩越好[15-16]。2.2 家庭背景对学业成绩的间接影响 已有文献不仅分析了家庭背景对学业成绩的直接影响,还从家庭投入等视角探究了其间接作用机制。倪雨菡等分析广州市12所中学500多名初三学生的样本发现,家庭学习资源、课堂参与在家庭社会经济地位与初中生阅读成绩间起着双重中介作用[17]。基于CEPS 2014年数据,薛海平探究了家庭资本影响教育获得的双通道机制,发现家庭资本能够同时通过学校教育机会优势与教育培训机会优势提升初中生在校成绩,进而影响初中生的高中及高等教育机会获得[18]。Long和Pang对来自我国5个城市约5000名九年级学生样本的研究结果表明,社会经济地位的3个组成部分(家庭拥有物、家庭教育资源和父母受教育程度)通过父母对子女的教育期望这一中介变量,对学生的数学成绩和问题解决能力(problem-solving achievement)产生显著影响[19]。李忠路和邱泽奇基于中国家庭跟踪调查2010年基线调查数据的研究发现,教育机会差异(包括体制内的重点学校与市场上的校外补习服务)和家长教育参与是家庭背景影响儿童学业成就的两条路径[20]。陈依婷和杨向东通过对某省会城市1000多名八年级学生数据的分析发现,亲子沟通与学业自我效能感均在家庭社会经济地位与数学成绩之间起部分中介作用[21]。Bae和Wickrama以441名12-14岁的韩国青少年为分析对象,发现父母监管和青少年的校外时间使用模式是家庭背景影响学生学业成绩的中介变量[22]。 综上所述,家庭层面的货币性资源投入(如家庭学习资源投入、为子女报补习班)及非货币性资源投入(如父母监管、亲子沟通)都会在家庭背景与学生学业成绩间发挥中介作用,这些发现为本研究的模型设定提供了重要依据。同时,在以下方面还有待进一步探讨:第一,国内部分研究的数据采集于某一个或某几个城市,从而导致样本的全国代表性相对较差;第二,在衡量学生学业成绩时,国内部分研究采用了家长报告的学生成绩等级或改编自国际学生评估项目(Program for International Student Assessment, PISA)问卷得到的成绩数据,前者的主观性太强,可能存在较大测量误差,而后者得到的成绩与学校考试成绩并不能完全等同,学校考试成绩或排名才是决定学生能否获得下一教育阶段入学机会的关键;第三,目前还没有文献将多个家庭非货币性资源投入变量纳入同一分析框架,但相较于家庭货币性资源投入,对家庭非货币性资源投入的干预或改善更为容易。鉴于此,本研究将基于具有全国代表性的CEPS数据,以学校提供的期中考试成绩为因变量,从家庭非货币性资源投入的视角,分析家庭社会经济地位对初中生学业成绩的影响,以及父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望等因素在两者之间的中介作用。3 研究设计3.1 数据来源 本研究数据主要来自CEPS 2013-2014学年的基线数据,该调查由中国人民大学中国调查与数据中心设计并组织实施。CEPS基线调查按多阶段的概率与规模成比例的抽样方法,在全国范围内抽取了112所学校、438个初中班级。入样班级的全体学生及家长、3门主科教师、班主任以及所在学校领导均被作为调查对象,最终获得近20000名初一与初三学生样本。问卷内容涵盖学生个人的基本信息、学业表现、教育经历、家庭以及学校等层面的信息,能够满足本研究主题的需要。根据本研究设计,将具有缺失变量的样本进行了删除,最终得到的有效样本为16742名初中生。3.2 变量说明3.2.1 因变量 研究因变量是2013年秋季学期学生的语文、数学以及英语3门主科的平均成绩。CEPS数据库记录了由受访学校直接提供的3门主科成绩的原始分,以及按学校与年级对3门主科原始分分别进行标准化处理后的得分。由于本研究采用的分析模型控制了班级固定效应,这一模型估计策略使得由受访学校提供的原始分同样具有可比性[23]。因此,最终采用3门主科的原始分,并对其取均值得到本研究的因变量。3.2.2 自变量 研究自变量为家庭社会经济地位。由于父母职业、学历以及家庭经济状况等因素具有高度相关性,将其通过因子分析等方法进行降维处理在理论上是可行的;且目前国际上相对成熟的基础教育质量评估项目,如PISA也采用家庭社会经济地位这一指标衡量学生家庭背景。因此,为简化模型,借鉴PISA的做法将家庭社会经济地位作为家庭背景的代理变量。具体而言,参照任春荣的分类[24],对父母最高受教育程度、父母最高职业、学生家庭经济状况、家庭藏书变量进行因子分析,得到家庭社会经济地位变量,结果显示KMO值为0.71,Bartlett’s球形检验的p值小于0.001,表明上述4个变量适合做因子分析。3.2.3 中介变量 研究主要讨论家庭非货币性资源投入在家庭社会经济地位与学业成绩之间的中介效应,因此,选取父母监管、亲子交流、家长与学生朋辈群体互动以及父母对子女的教育期望等4项作为中介变量。 参照Mu和Hu的研究[25],父母监管变量根据学生问卷中的以下8个题目构建:“你的父母在以下事情上管你严不严:作业、考试,在学校表现,每天上学,每天几点回家,和谁交朋友,穿着打扮,上网时间,看电视的时间。”所有题目的选项均为“不管”“管,但不严”“管得很严”,分别计为1分、2分、3分,并取8个题目得分的均值作为父母监管变量得分;得分越高,表明父母的监管力度越大。 根据李佳丽和胡咏梅的研究[26],亲子交流变量的构建综合了学生问卷中的5个题目:你父母是否经常与你讨论以下问题,分别是“学校发生的事情”“你与同学的关系”“你与老师的关系”“你的心情”“你的心事或烦恼”。所有题目的选项均为“从不”“偶尔”“经常”,分别计为1分、2分、3分,并取5个题目得分的均值作为亲子交流变量得分;得分越高,表明亲子交流越频繁。 参考周东洋和吴愈晓的做法[27],家长与学生朋辈群体互动这一变量来自家长问卷中的两道题目,分别是“您认识与孩子常在一起的朋友吗?”“您认识与孩子常在一起的朋友的家长吗?”。两个题目的选项均为“不认识”“认识一部分”“全部认识”,分别计为0分、1分、2分,并取两个题目的得分之和作为家长与学生朋辈群体互动变量得分;得分越高,表明家长与学生朋辈群体互动越多。 父母对子女的教育期望这一变量来自家长问卷中的题目“您希望孩子读到什么程度?”。借鉴张阳阳和谢桂华的变量定义方式[28],将答案选项中的“受教育程度”转换为“受教育年限”,具体转换方式为:初中毕业=9年,中专/技校/职业高中/普通高中=12年,大学专科=15年,大学本科=16年,硕士研究生=19年,博士研究生=23年。经过上述转换后,父母对子女的教育期望的取值范围为9~23,是连续型变量。3.2.4 控制变量 在个人层面,研究控制了学生性别(男生=1,女生=0)、年龄(连续型变量)、是否独生子女(是=1,否=0)、是否住校(是=1,否=0)以及户口类型(农业户口=1,非农户口=0)。此外,还控制了班级固定效应,目的是尽可能降低学校与班级层面的不可观测变量对学业成绩的影响。控制班级固定效应的具体做法为:先将学生所在班级这一多类别变量转化为多个虚拟变量,然后将其中一个虚拟变量作为参照组不纳入模型,将其他班级虚拟变量全部纳入回归模型。3.3 分析策略 借鉴温忠麟和叶宝娟在论文中提到的逐步法[29],通过构建方程(1)-(3),检验家庭非货币性资源投入的中介效应。此外,由于研究的中介变量与因变量均为连续型变量,因此采用普通最小二乘法估计方程(1)-(3)的回归系数。 Score=β0+cSES+β1I+θ+e1 (1) M=α0+aSES+α1I+θ+e2 (2) Score=γ0+c'SES+bM+γ1I+θ+e3(3) 方程(1)主要分析家庭社会经济地位与学业成绩的关系。其中,Score是因变量,表示学生学业成绩;SES是核心解释变量,表示学生的家庭社会经济地位,系数c表示家庭社会经济地位对学业成绩的总效应;I表示个体层面的控制变量;θ是班级固定效应;e1是随机误差项。 方程(2)用于分析家庭社会经济地位与中介变量的关系。其中,M表示中介变量,分别是父母监管、亲子交流、家长与学生朋辈群体互动以及父母对子女的教育期望;系数a是在控制了其他变量的影响之后,家庭社会经济地位对中介变量M的效应,研究将对4个中介变量分别进行回归分析,其他变量的含义与方程(1)相同。 在方程(3)中,系数b是在控制家庭社会经济地位及其他变量的影响之后,中介变量M对学业成绩的效应;系数c'则是在控制中介变量M与其他变量的效应之后,家庭社会经济地位对学业成绩的直接效应。中介效应等于系数a与b的乘积,总效应c、直接效应c'与中介效应ab的关系为:c=c'+ab。4 研究结果4.1 描述统计结果 研究首先以家庭社会经济地位的均值为界将全样本分成两组,其中低于均值的样本属于低家庭社会经济地位组,高于均值的样本则属于高家庭社会经济地位组,然后采用独立样本t检验分析不同家庭社会经济地位学生在学业表现以及家庭非货币性资源投入方面的差异。结果如表1所示,可以看到,所有学生的平均成绩是81.422分,家庭经济社会地位高于均值的学生(以下简称“高家庭社会经济地位学生”),其学业成绩显著优于家庭经济社会地位低于均值的学生(以下简称“低家庭社会经济地位学生”),前者比后者高13.666分。与学业成绩的检验结果一样,高家庭社会经济地位学生在4类家庭非货币性资源投入方面的得分也都高于低家庭社会经济地位学生,并且这种差异均具有统计显著性。例如,高家庭社会经济地位学生的父母监管得分为2.375,比低家庭社会经济地位学生(2.313)高0.062,达到显著性差异水平。 在学生个人特征方面,所有样本的平均年龄约为14岁,男女比例相等,有32%的学生在学校寄宿,44%的学生属于独生子女,农业户口学生占比为55%。4.2 家庭社会经济地位对初中生学业成绩的回归结果 研究采用逐步法分析家庭社会经济地位对初中生学业成绩的影响,并检验家庭非货币性资源投入在两者间的中介作用。 方程(1)和方程(3)的回归分析结果如表2所示。其中,模型(1)为基准模型,在控制了班级固定效应以及个人层面因素的情况下,家庭社会经济地位对初中生学业成绩具有显著的正向影响。家庭社会经济地位每提高1个单位,初中生学业成绩显著提高2.653分,即方程(1)中的系数c显著。模型(2)至模型(5)分别在模型(1)的基础上,加入了父母监管、亲子交流、家长与学生朋辈群体互动、父母对子女的教育期望。可以发现,这4个中介变量均对学生学业成绩具有显著正向影响,表明方程(3)中4个中介变量的系数b都显著。此外,这些中介变量均能够降低回归模型中家庭社会经济地位的回归系数,并且父母对子女的教育期望这一变量使家庭社会经济地位的系数下降幅度最大,由2.653降至1.869。由此能够推测,在4个中介变量中,父母对子女的教育期望的中介效应最大。4.3 中介效应检验结果 方程(2)的回归结果如表3所示,可以看出,在控制个人层面因素及班级固定效应之后,家庭社会经济地位能够显著提高父母监管力度、亲子交流频率、家长与学生朋辈群体互动程度以及父母对子女的教育期望,即方程(2)中的系数a均显著。根据逐步法的检验原理,因为系数a与b均显著,表明本文的中介效应均显著。此外,当系数a与b均显著时,逐步法的检验效力要高于Bootstrap法,因而不再采用Bootstrap法进行中介效应检验。同时,由于方程(3)中分别加入4个中介变量得到的系数c'也都显著,说明这4个中介变量均起着部分中介作用。 表4呈现了4个中介变量的总效应、各个中介变量的直接效应、中介效应以及中介效应占总效应比值。由表4可知,家庭社会经济地位对初中生学业成绩的总效应为2.653;在家庭非货币性资源投入这4个中介变量中,父母对子女的教育期望这一变量的中介效应最强,占总效应的29.53%,验证了前文的推测,其次是亲子交流,占总效应的9.64%,而家长与学生朋辈群体互动和父母监管的中介效应相对较弱,分别占总效应的2.39%和0.87%。5 研究结论与讨论 本研究基于CEPS 2013-2014学年的基线数据,以家庭社会经济地位作为指代家庭背景的变量,分析其对初中生学业成绩的影响,以及4类家庭非货币性资源投入因素在两者之间的中介作用,得到如下结论: 第一,不同家庭社会经济地位初中生的学业成绩以及家庭非货币性资源投入存在显著差异。独立样本t检验结果表明,高家庭社会经济地位学生的学业成绩显著优于低家庭社会经济地位学生;此外,与低家庭社会经济地位学生相比,高家庭社会经济地位学生的父母对子女的监管更加严格,与子女的交流更加频繁,与子女朋辈群体的互动更多,并且对子女抱有更高的教育期望。这与已有相关研究结论基本一致,即低家庭社会经济地位初中生在学业成绩与家庭非货币性资源投入方面具有双重劣势地位。 第二,家庭社会经济地位、家庭非货币性资源投入均对初中生学业成绩具有显著的正向影响。家庭社会经济地位越高,学生学业成绩越好,表明取样时我国教育不公平问题较为突出。此外,从4类家庭非货币性资源投入来看,父母监管对学生学业成绩的影响显著为正,可能的解释是,父母对子女“作业、考试”“在学校表现”等方面的严格要求,能够使子女了解家长的标准,从而端正学习态度,而良好的学习态度有利于学生学业成绩的提升[30]。此外,亲子交流也能够显著提升子女成绩,结合已有研究发现,亲子交流可能通过影响子女的学业自我效能感[31]、自我控制能力和学校适应能力[32],从而间接影响子女成绩。与父母监管、亲子交流对子女成绩的影响类似,家长与学生朋辈群体互动同样能够显著正向预测子女成绩;不同之处在于,父母监管、亲子交流这两类家庭非货币性资源投入是父母与子女双方之间的互动,而家长与学生朋辈群体互动则是父母与孩子的朋友,以及与孩子朋友的家长之间的互动。以往研究发现,父母与孩子朋友及其家长的互动越多,学生参与补习的可能性越大、家庭补习花费也越高[27];且大部分研究表明,适当的补习有利于提高学生成绩[33-34]。因此,家长与学生朋辈群体互动可能通过家庭对子女的货币性资源投入这一途径影响子女成绩。与前3类家庭非货币性资源投入的作用一样,父母对子女的教育期望越高,则学生学业成绩越好,其背后的原因可能是,随着父母对子女教育期望的提高,子女自身的教育期望、子女的学习时间,以及家庭货币性资源投入也会相应提高或增加[35-36],这些因素都能够提升子女的成绩。总体来看,4类家庭非货币性资源投入可能主要通过影响学生个人层面的因素(如学习态度、学业自我效能感)与家庭货币性资源投入,进而影响学生成绩。 第三,家庭非货币性资源投入在家庭社会经济地位与初中生学业成绩间发挥着部分中介作用。一方面,家庭社会经济地位能够直接提高初中生学业成绩;另一方面,家庭社会经济地位较高家庭还会通过增加家庭非货币性资源投入,包括父母监管力度、亲子交流频率、家长与学生朋辈群体互动,以及父母对子女的教育期望,从而间接提升初中生学业成绩。关于这些家庭非货币性资源投入影响成绩的具体路径,前文结合以往研究发现和本研究对中介变量的操作化定义进行了较为详细的分析,此处不再赘述。 第四,父母对子女的教育期望这一变量的中介效应最大,其次是亲子交流,而家长与学生朋辈群体互动、父母监管的中介效应相对较小。从中介效应占总效应的比值来看,父母对子女的教育期望能够中介将近30%的家庭社会经济地位对学业成绩的影响;亲子交流次之,为10%左右;排名第3的是家长与学生朋辈群体互动,为2.39%,父母监管的中介效应最小,仅为0.87%。 综上所述,初中生学业成绩受到家庭社会经济地位等先赋性因素的显著影响,家庭非货币性资源投入能够在一定程度上降低家庭社会经济地位对学业成绩的正向影响。这些研究发现对促进教育结果公平的政策具有一定的参考价值:一方面,应该重点帮扶家庭社会经济地位较差学生,以降低家庭背景因素带来的学业表现差异;另一方面,推动家庭教育指导服务中心建设,引导弱势家庭父母适当提高对子女的教育期望、加强与子女及其同辈群体的互动与沟通以及对子女的监管。 本研究存在以下不足:其一,研究使用的是截面数据,所以只能分析变量间的相关关系,无法确定某些影响路径的因果关系;其二,研究对家庭非货币性资源投入影响学业成绩的机制的探讨只是初步的、探索性的,有待采用实证数据对其进行检验;其三,家庭非货币性资源投入的中介效应可能受到教师、学校层面因素的调节作用[37-38]。因此,在后续研究中,可以采用追踪数据,分析家庭非货币性资源投入等因素在家庭社会经济地位与初中生学业成绩间的链式中介作用,以及有调节(如教师、学校层面因素)的中介作用。 参考文献:(略)(声明:本文选自《中国考试》,版权归属原作者,文章观点与本栏目无关,如涉侵权,联系立删!)
2023-11-07
骆方 王珊:第十四届海峡两岸心理与教育测验学术研讨会暨全国教育统计与测量学术年会会议综述原文刊载于《中国考试》2023年第9期第87—94页。作 者骆方,北京师范大学心理学部教授。王珊,北京师范大学心理学部研究助理。摘 要:第十四届海峡两岸心理与教育测验学术研讨会暨全国教育统计与测量学术年会近日于广州成功举办,会议主题为人工智能时代下的心理与教育测量。会议共设有5个主会场、24个分会场,交流研究报告216篇、海报展示83篇,来自两岸三地高校和相关机构的409位专家学者出席了此次会议。会议涵盖心理测验理论与技术、信息科技与测验发展、教育测验新进展、人事测评理论与技术、临床与咨询中的心理测验、发展性诊断与测评、统计模型新进展等议题,集中展示了海峡两岸暨香港专家学者研究的前沿成果和最新进展,促进了心理与教育测量领域的学术交流。 关键词:海峡两岸心理与教育测验学术研讨会;全国教育统计与测量学术年会;人工智能;心理与教育测量;智慧教育;智慧评价 2023年8月12日至13日,第十四届海峡两岸心理与教育测验学术研讨会暨全国教育统计与测量学术年会在广州华南师范大学成功举办。研讨会由中国教育学会教育统计与测量分会、中国心理学会心理测量专委会以及中国测验学会(台湾)3家学术机构联合发起,自1993年起每两年一届,轮流在海峡两岸举办,旨在深入探讨心理与教育测验及统计科学等前沿发展议题,带动并活跃海峡两岸学术氛围,促进海峡两岸学术交流。 本届研讨会主题为人工智能时代下的心理与教育测量。会上,两岸三地的409位学者齐聚一堂,来自北京师范大学、华东师范大学、江西师范大学、华南师范大学、台湾师范大学、台北教育大学、台中教育大学、台南大学、成功大学、台北商业大学、香港中文大学等70余所高校,以及教育部教育考试院、微软亚洲研究院等20余家教育考试机构、中小学和相关企业的代表共同参会。1 海峡两岸携手并进,心理与教育测量同仁共迎人工智能新时代 我国教育评价改革目前处于攻坚克难阶段,亟需多学科融合的教育评价技术创新的积极推动。2020年10月13日,中共中央、国务院印发《深化新时代教育评价改革总体方案》,强调要“创新评价工具,利用人工智能、大数据等现代信息技术,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价。”[1]这充分体现了我国对人工智能(artificial intelligence, AI)与大数据等新技术、新手段助力教育评价改革的重视和期望。1.1 人工智能助力提升教育的综合评价、过程评价和增值评价水平,完善教育评价机制 围绕大会主题,中国教育学会常务副会长李天顺教授提出,在深入研究各级各类教育内在规律和时代特征的基础上,发挥自身专业特长,为解决教育评价的难题贡献智慧和力量。一是着眼健全综合评价,充分运用人工智能助力的教育评价,进一步全面评估学生发展。例如:利用数字化、信息化等手段来客观记录学生品行的日常表现和突出表现,完善德育评价;使用可穿戴设备等新型设施和技术,记录学生日常体育参与情况和体质健康水平;等等。二是着眼强化过程评价,进一步深度挖掘教育和学习过程中的数据。过程性评价的关键一环是数据获取和应用,如何借助人工智能和教育大数据技术,对学生进行一系列过程性、伴随性、无觉察的测评,使测评的方式和类型更加丰富、结果更加准确,是强化过程性评价的重要抓手。三是着眼探索增值评价,进一步了解学生的成长和进步。借助人工智能和大数据挖掘算法的支撑,便于更加精确地评估每一名学生的成长曲线,进而更加深入地了解学生的成长和进步。四是着眼完善评价机制,进一步探索更深层次的教育教学规律。通过挖掘、分析教育大数据,量化学习过程,表征学习状态,发现影响因素,找到干预策略,从更深层次揭示教育规律,使其为区域教育管理提升等教育实践服务,推动教育评价结果更好、更扎实地发挥作用。1.2 人工智能等新技术推动测量方法和测验工具的创新发展 人工智能时代的到来,使心理与教育测量领域面临诸多机遇和挑战,也推动了测量方法和工具的创新与发展。中国测验学会(台湾)理事长林素微教授认为,两岸无论从实践需求、面临的挑战和学科发展机遇上,都存在着很多共性的特点。林素微教授分享了台湾地区数字教学与数字化测评的发展现状与成效。顺应大型国际调查的发展趋势,中国测验学会(台湾)致力于推广教育大数据资料的串接、分析与应用,包括国际阅读素养进展研究项目(PIRLS)、国际数学与科学趋势研究项目(TIMSS)、国际学生评估项目(PISA)、国际公民意识和公民素养研究项目(ICCS)、国际计算机与信息素养研究项目(ICILS)等国际调查。此外,会上讨论并分享的数字化测验与评价的技术与实务应用、信息科技在教育与心理测量上的应用等内容,为教育政策规划提供了参考。1.3 心理与教育测量技术进步,推动教育事业高质量发展 心理与教育测量在教育发展中具有重要意义,既为教育决策提供科学依据,又能很好地推动教育综合发展。作为大会承办单位,华南师范大学党委书记王斌伟认为,当前人工智能技术正以前所未有的速度和广度影响着我们的生活。在实现全面建设社会主义现代化国家的目标过程中,优质的教育和人才培养是关键因素。会议以“人工智能时代下的心理与教育测量”为主题,具有重大的现实意义和深远的战略意义,旨在进一步推动心理与教育测量朝向数字化、信息化的方向发展,进一步促进心理与教育测量学科建设,为推动教育考试事业高质量发展、培养高素质的社会主义建设者和接班人,进而实现中国式教育考试现代化提供有力支持。2 主会场高屋建瓴,聚焦数字化考试与教育手段提升 随着信息技术的飞速发展,借助数字化手段获得大量的学习和行为数据成为可能。应用数字化、智能化信息技术手段,深入分析数据,用以发现学习趋势、认知模式和效果评估等方面的规律,从而指导教育改革和个体干预。2.1 建设与智慧教育相适应、服务智慧教育的数字化考试系统 教育部教育考试院党委副书记、副院长于涵研究员在专题报告中提到,作为国家教育制度的组成部分,我国大规模教育考试在保障教育公平公正、服务拔尖创新人才培养、促进人力资源优化、助力经济社会发展等方面发挥着积极作用。随着国家教育数字化战略行动深入推进,利用现代数字技术和理念助力教育考试内容、形式、评价及治理改革,建设与智慧教育相适应、为智慧教育服务的数字化考试体系(简称智慧考试),是我国教育考试现代化进程中一项重要且急迫的任务。教育部教育考试院聚焦国家教育数字化战略行动总体要求,对标智慧教育总体架构,以数字化思维重构考试业务流程,提出以智慧考试为核心概念的全新考试业务系统,描绘我国大规模教育考试数字化发展的愿景和技术路线。智慧考试服务于智慧教育主要体现在3个方面:第一,为智慧教育提供高质量的数据资源,包括面向考试全环节的海量题库、命题素材、无感信息和考生作答信息等;第二,智慧考试的评价结果在教学端服务于学生学习和学校教学,在教育端服务于教育评价和教育改革;第三,通过可及性更好的考试促进教育公平,通过准确性更高的评价保障教育质量,通过适配性更强的考试与智慧教育总体架构实现深度嵌套、全面融合。2.2 拓展自适应个性化学习、评估与反馈的教育新模式 人工智能技术可以更精确地衡量个体的认知、情感和学习进展。个性化测量手段能够实现对个体认知、情感和学习进展进行精准化测量,分析其学习状态与学习结果,为每个学习者设计定制化的评估方式和学习计划。基于人工智能的自适应学习和测量系统则能够根据学生的表现和需求调整教材和测验的难度和内容,使学习过程真正基于学生自身水平进行,从而更好地满足其学习需求和发展潜力。 台湾地区于2017年至2020年实施前瞻基础建设计划,已完成智慧教室与网络带宽设施。疫情发生后,在现有数字化建设基础下,台湾当局提出《推动中小学数字学习精进方案》,规划数字内容充实、行动载具与网络提升及教育大数据3项计划,加速数字化教学推动,以期达成教材更生动、书包更轻便、教学更多元、学习更有效、城乡更均衡五大目标;建设“因材网”,涵盖1-12年级学科教材、素养教材、游戏教材和资讯科技等内容。系统实现了计算机化动态测评学习分析,动态测评由选择题组成,当学生尝试作答错误时,系统会针对错误类型给予适当的反馈,在评估的同时协助学生学习与解题。2.3 依托过程测评,为复杂问题解决能力评估提供全新测评范式 北京师范大学心理学部刘红云教授较为全面和系统地总结介绍了近几年复杂问题解决能力的过程测评与测量模型发展。自20世纪90年代,核心素养(key competencies)已成为全球范围内教育实践和研究领域的重要议题。核心素养的复杂性使得传统的教育测验范式难以直接应用,需要教育测量理念、方法和技术的系统性革新。近年来,信息技术进步为以复杂问题解决能力为代表的核心素养测评提供了全新的测评范式。依托计算机的交互式测验,能够在仿真任务情境下实时记录学生的反应过程,对学生解决复杂问题解决能力的过程进行测评,并保存为过程数据。过程数据蕴含关于学生认知与思维活动的丰富信息,对这些信息进行挖掘与分析有利于对学生潜在能力进行更加准确的估计。 在专题报告中,刘红云教授系统介绍了过程测评的缘起、特点以及测验设计的核心内容并结合过程测评,对数据挖掘方法与测量模型结合的前景进行了展望。2.4 加速领域融合创新进程,提升与丰富心理与教育测评技术及手段 心理测验诞生至今已逾百年,现已被广泛应用于教育、企业管理、临床医疗等领域,发挥了重要作用。然而,传统心理测验本身的一些局限,如问答形式带来的个体焦虑与外在表现水平的降低、自陈式量表造成的不认真作答和作假现象、测验曝光率过高等问题,使其在应用中面临诸多挑战。 信息技术发展为心理与教育测评技术和手段的创新提供了新的解决思路。北京师范大学心理学部黎坚教授介绍了基于游戏的评估方式与最新进展。基于游戏的评估(game-based behavior assessment, GBA)是指通过游戏或者游戏化的活动来对某一对象进行评估。从心理学的角度来说,GBA就是采用游戏的方式,对一个人的能力、人格等心理特质和行为进行量化评估。由于具有可玩性、隐蔽性与仿真性3大优势,GBA能够较好地应对传统心理测验面临的受测者作答动机不高、测验焦虑、测验情境远离现实等问题,已逐渐应用于实践。 北京师范大学心理学部骆方教授团队则开发了系列人机交互式测验,包括创造力、批判性思维、复杂问题解决、计划能力、科学探究能力等测验。这些测验基于证据中心设计(evidencecentered design)框架研发,采用不同测验任务载体,对测验过程性数据的分析也各有不同。报告介绍了从基本的场景化设计、情境性设计到基于虚拟现实的多种设计方式,并从题目作答正确性、作答反应时间和文本数据3方面实现自动化计分。报告强调基于测验的目的和施测条件需要选择恰当的方法来完成整个测验的研发过程,为实际的测验设计与开发提供了经验借鉴。 台中教育大学教育资讯与测验统计研究所的吴慧珉助理教授介绍了高阶能力题型及其自动计分机制的相关研究。研究利用自然语言处理预训练的BERT(bidirectional encoder representation from transformers)模型语言识别技术,对文字进行自动识别,将其运用于考生作答发音的评分中,大幅降低人工评分的主观性和不确定性研究通过计算机手段辅助,模拟了一系列问题情境,使得测评情境更加真实、更能准确评估高阶能力,如可以实现对数学开放题的自动化评分,体现了自然语言处理的能力与优势。 技术进步推动心理与教育测量领域发展,而心理与教育测量手段也能够反向为技术发展提供一些有趣的研究与评价视角。来自湖南师范大学测评研究中心的杨志明教授研究团队,结合英语原著《Charlotte’s Web》阅读训练编制了一套批判性思维测试并分析了ChatGPT的作答结果。结果发现,ChatGPT给出的作答理由比较肤浅,基本上是从题干或答案选项中重抄一部分文字,这可能也意味着ChatGPT在回答问题时重在计算文本之间的相似度,而不是具有真正的思考能力。3 分会场报告异彩纷呈,共同探索教育与心理测量发展新路径 此次研讨会开展了多种形式的学术交流。研讨会共设有5个主会场,24个分会场,汇集学术前沿报告发言216篇、海报报告发表83篇,涉及统计模型新进展、发展性诊断与测评、心理测验理论与技术、信息科技与测验发展、教育测验新进展、人事测评理论与技术、临床与咨询中的心理测验等重要议题。与会专家在各自领域的探讨与研究,为人工智能时代下的心理与教育测量描绘了精彩的未来图景。3.1 统计模型的前沿进展 在统计方法及其应用分会场,与会者围绕统计建模及应用前沿进展展开了深入的探讨。一方面,聚焦于心理统计领域的方法前沿问题,围绕追踪数据分析、结构方程模型等主题广泛开展方法研究,提出新的统计分析方法以及优化改进已有方法的新思路,为心理、教育等学科研究的开展奠定统计方法基础。另一方面,从心理学理论和实证数据出发,应用前沿统计分析方法探究变量之间的关系,挖掘数据中的规律。例如,探讨家庭照料与老年人生活满意度之间的关系、分析父母教育卷入类型、探究学习动机对学习投入的影响等。这些实证研究为心理学理论的构建和验证提供了实证基础,为日常生活和教育教学等提供了有益的启示,有效地促进了统计分析方法的发展以及心理学理论的建构与验证。学者们在会场中积极交流研究成果,探讨前沿统计方法和应用课题,进一步推进了统计方法领域研究的进展。3.2 认知诊断研究进展 在认知诊断专场报告中,与会者汇报了认知诊断研究的前沿进展,具体包括如下议题:在认知诊断模型开发上,基于实际提出参数与非参数化的多策略模型等,并联合作答数据与过程性数据构建模型;为了解学习者的动态学习过程,开展基于两阶段增强信息的研究,构建学习模型;为提高认知诊断计算机化自适应测验(cognitive diagnostic computerized adaptive testing, CD-CAT)结果准确性,促进其实践应用,从参数与非参数结合等方面开发新选题方法,探索在线标定方法和可修改答案CD-CAT;梳理Q矩阵理论及其进展,对Q矩阵估计、被试拟合指标、贝叶斯参数估计等进行研究;基于已有理论研究,积极展开应用研究,将认知诊断应用于数学核心素养评估、比例推理学习进程等。所报告的研究兼具深度和广度以及创新性,丰富了认知诊断领域研究的内容,为该领域的研究提供新的视角与思路。在教育测评中可服务于教师的因材施教以及学生个性化学习方案的制定,以达到诊断结果促进学习和教学、有效减轻学生考试压力和负担的目的,最终促进智慧学习、高效学习、轻松学习。3.3 题目作答时间建模与应用 在题目作答时间(response time, RT)建模与应用分会场报告中,与会参与者探讨了RT这一具有代表性的多模态数据在心理与教育测量中的理论和实践应用价值。例如:为进一步实现对传统题目作答精度(response accuracy, RA)和 RT的准确客观分析,提出基于广义项目反应理论模型簇和对数正态RT模型的广义联合层级建模框架;为探究潜在能力和潜在加工速度之间的并行交互发展,提出针对纵向RA和纵向RT数据的纵向联合建模框架。在模型构建之外,面对心理与教育测量中快速猜测等异常作答检测所面临的难点问题,与会者还探讨了RT在快速猜测等异常作答检测中的应用,提出联合RA和RT的变点分析法、联合RA和RT的诊断分类树模型和联合RA和RT的混合层级认知诊断模型。这些模型建构和实践应用对于加快推进心理与教育测量中多模态数据的分析与利用具有重要价值,既为我国智能化考试的数据分析提供方法学支持,促进我国智能化考试落地,也为学习科学和教育数据挖掘等相关领域研究者提供方向参考。3.4 心理健康新型测评的研究与实践 在心理健康新型测评专场报告中,与会者分享了与特殊测评技术和机器学习算法结合的心理健康评估的研究现状,还探讨了如何简化和优化传统的心理健康评估工具,以适应数字时代的需求,为实现心理健康的准确测评提供了全新视角。与会者围绕心理健康测评中的热点难点问题展开讨论:针对传统测评无法解决的社会称许性的问题,提出采用投射测验和条件推理测验等形式的测验进行测量;针对传统测评筛查费时费力的问题,提出结合大数据和算法实现无侵扰大规模测量。在中国式教育考试现代化的背景下,这些方法技术创新为更客观、全面地评估学生的心理状态提供了可能,有助于更好地关注学生的整体发展,对于推进心理健康测评领域的技术创新和应用具有重要价值。3.5 组织中的人事测评新视角 在组织中的人事测评专场报告中,与会者聚焦当前人事测评领域难题,结合层面理论、项目反应理论、认知诊断理论等测量理论和机器学习领域视角,针对测量工具的理论构想设计与验证、受测者作假及甄别、自适应题库的建设等一系列亟待解决的前沿问题展开探讨,为解决上述问题提供了充足的理论与数据分析模型。在前沿理论的指导下,与会者探讨了各测量形式及其应用优势:基于游戏的评估能够较好解决受测者的测验焦虑等问题;迫选测验和条件推理测验能够较好应对作答过程中受测者的作假行为倾向、具有较高的抗作假能力;而开放式情境测验则能够在具备高拟真性的同时,使用ChatGPT实现自动化评分。各专项报告从测评形式设计、受测者作答模式、测评数据分析、测评题库建设等角度出发,探索实践应用问题的理论解决方案,锚定理论研究构想的落地应用场景。在人工智能这一时代背景下,专项报告形成的智慧结晶为组织中的人才选拔与评估贡献新思路,为人事测评领域研究开阔新视野。3.6 人机交互式测评技术探索 在人机交互式测评专场报告中,与会者从测评的任务设计、测评的数据分析和测评的实践应用3个角度出发,探讨了人机交互式测评、基于游戏的测评等人机交互式测评工具在心理测量领域的巨大潜力。所报告的研究多采用反应时间、眼动数据、过程性指标等丰富的数据类型对复杂任务进行分析,介绍如何使用序列分析、网络分析等方法,在过程性数据的帮助下分析任务完成过程中的个体差异。在新型测评的开发过程中,测验的设计思路、收集的过程性数据的类型和数量以及使用过程数据的方式都发生了巨大的变化;随着技术的不断发展与进步,新型测评还可能采集更广泛的数据,包括生物识别(如心率、面部表情)和基于手势的输入。技术的进步使得设计和开发各种精巧、便携的测评工具成为可能,随着统计建模和数据分析的发展,还可以实现更快地收集、分析、可视化评估数据,有助于在学习环境中进行更有效的测评。除此之外,基于交互性、新颖性、及时反馈等特点,交互式测评工具还可以被用于训练和辅助学习。人机交互式测评不仅可以帮助提升学生的思考能力和学习方式,而且有助于更加全面地评估学生的能力,在教育和考试领域具有广阔前景。3.7 ChatGPT在心理与教育测评场景中的应用 在ChatGPT与心理教育测评专场报告中,与会者对以ChatGPT为代表的生成式AI大模型在心理教育测评领域中的现有及潜在应用场景进行了讨论。有学者报告了在作文自动化评分、开放式测验作答评分等任务上ChatGPT模型的表现,展示了ChatGPT在心理教育测评任务上的巨大潜力。此外,如何审视ChatGPT这种通用人工智能也成为热议的话题,有研究者从人格、高阶思维等视角,通过专业的心理测验工具对人类群体、ChatGPT、GPT4等进行了评价对比,提出GPT系列大模型尚存在的不足。这些研究结果对如何建立长久的人机协同机制、如何应用大模型改进心理教育测评等提出新的思路,对探索大语言模型技术如何服务于中国式教育考试现代化具有重要学术意义和参考价值。3.8 教育质量监测和学业测评 教育质量监测和学业测评分会场的报告人来自高校、中小学和教育测评机构,报告主题涉及质量监测、测验改进、学习分析3个方面。与会者探讨了区域基础教育质量监测的需求和挑战,提出以整合的思路建构区域教育质量监测方案,以应对监测结果应用不足的问题;围绕测验的开发与改进,与会者探讨了测量理论和方法、心理学实验方法、人工智能与技术对命题和测验编制、测验实施、评分技术、分数报告等方面的进展;与会者还探讨了基于人工智能对学生学习过程的刻画,以及对不同类型学生的识别和帮助的策略,为教师的教学改进提供了新的可能。这3个方面的报告,充分体现出监测与改进融合、测评与学习融合、测验技术与人工智能融合的重要性与必要性。此外,也可以从与会者的交流中了解到,高校、中小学和教育机构的合作十分必要,且前景广阔。3.9 人工智能时代教育测量学面临的挑战与机遇 在人工智能与教育考试专场报告中,与会者探讨了人工智能时代教育测量学面临的挑战和机遇,提出智慧考试学评融合的理论架构,把量子测量的思路和方法引入教育测量,为构建人工智能时代下的教育测量基础理论提供全新视角。在理论探讨的基础上,与会者还探讨了高校人才选拔中的热点和难点问题:针对高考综合改革中的选考科目等级计分问题,提出借助统考科目成绩为选考科目建立通用能力量尺的思路;为对标人工智能时代下的人才需求,提出从评价理念、试题呈现、评卷方式等维度改革考试内容和形式的思路。这些理论探讨和实践改革思路聚焦教育考试高质量发展,探索适应人工智能时代要求的教育考试新理论、新模型、新应用,打造为育人选才全过程服务的考试新业态,对于加快实现教育考试现代化具有十分重要的意义。此外,本场报告以教育考试机构中青年学者为主体,面对人工智能技术的发展,他们以数字化思维重构考试业务流程,对数字化考试业务系统进行学理化阐释、学术化表达,为教育考试学术共同体的建设和发展注入了新的活力。 经过为期两天的高密度学术交流,主题丰富、层次多样的研究报告使与会者充分了解教育与心理测量领域的前沿进展和热点问题,对如何利用技术进步、迎接技术挑战有了更为深入的思考,对人工智能浪潮下心理与教育测量未来发展趋势有了更加清晰的认识;各领域的专家学者也各尽所能,来自不同地区、不同类型单位的专家学者、研究生、中小学教师以及教育机构与企业的实践工作者等,相互平等交流、深入探讨学术问题、碰撞学术思想、助力学术互鉴,推动构建海峡两岸暨香港学术共同体的融合发展。 大会将“海峡两岸学术交流杰出贡献奖”郑重授予侯杰泰教授、吴武典教授、车宏生教授和冯伯麟教授等4位教授,以表彰他们在推动海峡两岸学术交流与合作中作出的突出贡献。另有24位参会代表获得“青年学者大会论文奖”。 特别感谢陈睿、曾平飞、涂东坡、詹沛达、田雪涛、李辉、王欣夷、程雪迎、张照辉等同志对本文的贡献。 参考文献:
2023-09-25
孟照海:以中国教育学知识体系支撑教育强国建设 来源:中国社会科学网 - 中国社会科学报 习近平总书记指出,建设教育强国是中华民族伟大复兴的基础工程。拥有一套解释和说明自己的知识体系是任何一种文明的核心内容,而推进中华民族伟大复兴,关键是重建中国自己的知识体系。近现代以来,世界教育强国的崛起通常伴随着本国教育思想家及其理论体系的成熟。从英国洛克的绅士教育,到法国卢梭的自然主义教育,再到德国康德和赫尔巴特的唯理论教育,进而到美国杜威的民主主义教育,世界教育强国的形成不仅体现在先进的教育制度和较高的国民素质上,更在于教育制度与实践背后的教育思想和理论体系。从1901年我国学者译介西方教育学开始,在百余年的发展历程中,我国教育学经历了“在中国的教育学”“教育学中国化”到“中国教育学”的历史演变,逐渐从对西方教育学的“学徒状态”走向自主和成熟。面向2035年建成教育强国的目标任务,需要我们思考与之相匹配的中国教育学知识体系是什么?教育学知识如何成为教育强国建设的思想和理论先导?如何将中国教育理论上升为普遍的规律性认识,进而为世界贡献中国教育智慧?这些问题成为建设教育强国必然要回答的关键问题。 教育强国需要什么样的教育学知识体系 一是体现继承性民族性。习近平总书记指出,“如果没有中华五千年文明,哪里有什么中国特色?如果不是中国特色,哪有我们今天这么成功的中国特色社会主义道路?”国外教育制度可以模仿,教育实践可以参照,教育思想可以借鉴,但教育强国之路必然是内生的和自主的。走别人的路即便做得再好,也只能跟在别人后面。只有走自己的路,才能真正走向自主、成熟与强大。德国理性主义精神催生了洪堡的现代大学理念,美国实用主义哲学催生了杜威的民主主义教育,具有世界影响力的教育思想和理论必然植根于民族文化传统的深厚土壤中,这是教育强国的历史基因和文化内核。中华民族有百万年的人类史、一万年的文化史、五千多年的文明史。先秦诸子百家的思想灿若星河,留下了《论语》《学记》《劝学》等传世经典,儒家的“有教无类、因材施教、教学相长、循序渐进、温故知新、知行合一”以及道家的“为学日益、为道日损”等思想,始终是中国教育理论和实践创新的“根脉”。 二是体现原创性时代性。习近平总书记指出,“哲学社会科学的特色、风格、气派,是发展到一定阶段的产物,是成熟的标志,是实力的象征,也是自信的体现”。中国教育学的主体性和原创性突出地体现在中国教育学派的形成和标识性教育学概念命题理论的提出上。近代以来,面对作为“舶来品”的教育学,兼具中西方教育经历的我国知识分子,始终在追求构建中国自己的教育学。在教育学自主知识的建构中,蔡元培的“以美育代宗教”以及“学术自由、兼容并包”思想、黄炎培的职业教育思想、陶行知的生活教育思想、陈鹤琴的“活的教育”思想、梁漱溟的乡村教育思想等,都是本土化教育思想探索的典范。20世纪80年代以来,围绕教育本质的大讨论,掀起了新一轮教育思想解放运动,开创了教育学“一个时代的集体荣耀”,涌现出一大批当代中国教育学的奠基者和开拓者。从百余年来中国教育学知识的发展来看,紧扣时代脉搏、发掘传统文化和结合中国实践,是中国教育学彰显原创性和时代性的基本途径。 三是体现系统性专业性。在哲学社会科学的学术等级制度中,教育学的学科地位并不算高。1806年,作为“科学教育学奠基人”的赫尔巴特在创立现代教育科学时,将教育学建立在伦理学和心理学的基础之上,从而使教育学成为其他哲学社会科学的应用领地。第二次世界大战后,随着社会科学的兴盛,哲学、心理学、社会学、经济学、政治学、文化学、人类学、统计学等学科大举“入侵”教育学领地,教育学从单数的教育学发展成为复数的教育科学,从而引发了“教育学终结”的惊呼。同时,教育学内部分化出课程教学论、德育论、学校管理、教育技术学以及高等教育学、学前教育学等分支学科。百余年来,教育学在追求科学化的道路上,出现了“内解”和“外化”两种倾向,导致教育学科知识成为“松散的联盟”。教育学知识内部逻辑性和自洽性的不足,直接影响其解释力和批判力的形成,而这也致使教育学屡屡被外界指责为“无用的学科”。教育强国建设所需要的中国教育学必然是“内外兼修”,既保持开放科学的心态,又专注于学科核心知识的建构,以解释力和批判力的提升为教育学赢得合法性。 中国教育学知识何以自主 一是在中西关系上的自立。美国学者沃勒斯坦指出,18世纪历史学、政治学、经济学、社会学、人类学等社会科学从诞生起,都是围绕西欧资本主义国家转型期的经验和问题展开探讨的。建立在“理性人”“政治人”和“现代性”等前置假设基础之上的西方社会科学具有“情境适用性”,不一定适合中国传统文化和认识范式。面对现代技术给人类社会带来的诸多不确定性和风险,联合国教科文组织(UNESCO)在《反思教育》等多份重要报告中指出,人类社会的发展将更加凸显人文价值的重要性。“讲仁爱、重民本、守诚信、崇正义、尚和合、求大同”等中华优秀传统文化精神,能够为人的全面发展和解放以及构建人类命运共同体提供中国智慧和解决方案。2018年,经济合作与发展组织(OECD)启动了“社会情感能力调查”大型测评项目,而这种能力恰恰是中国传统文化中“学以成人、以德为先、仁者爱人、立己达人”等思想所强调的。中国教育学知识建构要摆脱“学徒状态”,从依附走向自立,需要建立在对中华优秀传统文化的自信之上。 二是在内外关系上的自主。教育学科“入门易,登堂难”。与经济学、社会学等其他社会科学相比,教育学科的门槛相对较低。但凡有点教育工作经历或对教育问题有所思考的人,都能够成为教育学知识的建构者。一些高校管理者即便没有受过专门的教育学科训练,但凭借工作经历也可以成为教育学科的博导。在教育学的学术场域中,政治逻辑、经济逻辑、社会关系逻辑常常超越学术逻辑成为支配法则。在学科建设、学位授予、论文发表、课题评审、学术评价和学术会议等活动中,让学术回归学术的呼声日益强烈。为增强教育学的学术自律性,不仅要坚守学术场域的规则,抵御“官大学问大”“学术资本主义”等非学术逻辑的侵蚀,而且要激发内部的学术活力,防止因学术分层和等级结构“板结化”而阻滞学术流动和知识创新。 三是在学科关系上的自强。在学科知识生产中,首先要明晰教育学知识与非教育学知识的区别。每个学科存在的合法性前提就是有专门的研究领域和问题。然而,教育学科的边界相当模糊,其结果是“种了别人田,荒了自家地”,该研究的不研究(学校时空框架之外的教育),不该研究的却去研究(教育中的经济、政治、社会和文化现象)。为了给自身的科学化寻找论据,教育学常常把其他学科的理论作为自己的基础,并且希望“婆婆越多越好”,只要跟教育沾边,“有奶便是娘”,从而迷失在科学化和学科化的追求之中。教育学知识自主性的确立,建立在学科意识、学科立场和学科视角的实践反思基础之上。强调学科意识和学科边界,不是走向学科的封闭,而是在于专注学科核心知识的建构,确保学科内部知识的逻辑自洽性,从而为促进人类知识增长作出教育学科独特的贡献。 开放时代中国教育学如何发展 一是处理好中国特色与普遍知识的关系。北京大学教授张静认为,社会科学正在努力让世界“读懂中国”,但普遍采用的方式是论证我们的独特性——本土特征、差异模式、独特道路,这么做不是不对,但效果有限。西方文化长于概念思维和理论建构,而中国文化则长于经验思维和比附联想。西方学术理论的强大在相当程度上得益于其学术表达,这种表达具有思想的规范性和时空的穿透力。人力资本理论、教育收益函数、文化资本、教育分层和流动等理论,尽管产生于西方国家,但其影响远远超越资本主义世界。不重视理性思维、概念表达和理论建构,所取得的经验性认识就只能是局部的、个别的现象,其他地域或文化就没有关注这种知识的必要。在推进中国教育学体系建设过程中,要警惕过度强调特殊性的民粹主义倾向,既要重视本土经验的总结提炼,又要重视公共知识的学术表达,从特殊走向一般,为世界教育学知识贡献中国理论。 二是着力提升中国教育学的主体性和原创性。坚持马克思主义基本原理同中国具体实际相结合、同中华优秀传统文化相结合,是中国哲学社会科学理论创新的必由之路。改革开放以来,中国教育学的原创性知识源自一批学养深厚且有相同集体经历的学者,他们将马克思主义思想与具体教育实践和中华优秀传统文化相结合。基于马克思对人的本质的认识,叶澜指出,中国教育学理论需要实现从“抽象的人”到“具体个人”的转换。基于马克思主义辩证唯物论和实践观,鲁洁提出“教育的适应与超越”,对“教育万能论”和“教育无能论”等二元对立认识进行了理论澄清。从教育的文化基础出发,顾明远开创了民族文化传统与教育现代化的关系研究。根据马克思主义实践观和人的发展理论,裴娣娜推动了主体教育实验。“两个结合”推动中国教育学不断提升主体性和原创性,生产出具有中国特色和广泛影响力的教育学知识。 三是系统化构建中国教育学的话语策略。提升中国教育学的话语权和国际影响力,需要进行系统的策略构建。在对中国教育实践的解释上,要抢占话语先机。习近平总书记指出,在解读中国实践、构建中国理论上,我们应该最有发言权。知识生产具有“先占原则”,如果不重视对中国丰富实践的学术“占领”,一旦这些领域成为他人知识生产的“领地”,我们的学术研究就会处于被动的跟随状态。此外,当前我国的学术话语表达还较弱,未能产生一批具有广泛影响力的学者和理论知识。因此,要加强中国教育理论的学术表达,形成具有标识性的新概念新范畴新表述,实现“中国经验、国际表达”,以对世界教育学知识增长的贡献获得国际认可。 来源 | 中国社会科学网 - 中国社会科学报 作者 | 孟照海(中国教育科学研究院科研管理处副处长、副研究员)
2023-08-07
刘彭芝丨基础教育高质量发展的“四梁八柱”《中国教育现代化2035》将“到2035年,总体实现教育现代化,迈入教育强国行列”作为推进教育现代化的总体目标。党的二十大报告再次强调“加快建设教育强国”。教育强国建设,基础教育是基石,应该大有作为,也能够大有作为。基于担任中国人民大学附属中学副校长、校长、名誉校长30多年,特别是近20年来参与对欠发达地区教育帮扶的经历和体会,我认为,今后一个时期,基础教育要实现高质量发展,在教育强国建设中大有作为,撬点在“双减”、平台在均衡、抓手在科技、亮点在拔尖创新人才培养。从战略高度对待“双减”发挥“双减”对新时代基础教育的撬点效应 “双减”政策发布近两年来,有关“双减”的认识和实践都在持续深化,但总的来说,我们对“双减”的认识和实践,无论是高度、广度还是深度,都还远远没有到位。如果说“双减”是一篇起承转合的大文章的话,那么现在还只是处在“起”的阶段,接下来还有更多、更大、更实、更新的工作要做。“双减”既是一次破冰之旅,也是一场宏观战役。以“双减”为撬点、从“双减”切入,基础教育要进行的是一场从观念到实操的全面革新。 “双减”是表,效能是里。对“双减”政策最准确、最完整的解释,应该是“减负增效”。减负和增效,是一枚硬币的两面。学生的作业负担和课外培训负担减下来了,但教师仍然要应教尽教,学生仍然要学足学好,这就必然要求教学效能大大增强。落实“双减”的过程,实际上是一减一增、一降一升的过程。减的、降的是作业数量,增的、升的是作业质量;减的、降的是课时长度,增的、升的是课堂效率。“双减”之难,难的不是减而是增。减负的工作已逐步到位,增效的工作任重道远。“双减”对教师的教、学生的学,对教学效能的要求,都比过去更高、更严、更实了。减负容易,增效难。 “双减”是有所不为,是“破”,有所不为是为了更好地有所为;有所为,是“立”。破字当头,立在其中;破,是为了立。新时代之下,“双减”应在“五育并举”上有所作为,在脑手并用、知行合一上有所作为。“双减”后,学生可自主支配的时间多了,要让这些时间用在操场上,用在阅览室中,用在实验室里,用在社团活动中,用在放飞想象力、激发创造力上。“双减”的旨趣是解放学生,身心解放了,我们才能更好地培养学生的创新精神和创造能力,才能将知识更顺畅地转化为智慧,才能让学生中不断涌现拔尖创新人才。从这一点来看,“双减”最根本的“立”,是让教育回归校园、回归原点、回归本质、回归常识、回归学习生活的本来面目。 牵一发而动全身,一子落而满盘活。新时代基础教育改革创新的第一枪由“双减”打响,“双减”成为新时代基础教育守正创新、繁荣发展的最佳撬点。我们要通过“双减”以及关联的配套措施,破解教育难题,舒缓教育焦虑、消除教育内卷、凝聚教育共识、稳定教育预期、维护教育公平、增强教学效能、提高教育质量。我们要把“双减”与“五育并举”、全面发展有机结合起来,与因材施教、培养拔尖创新人才有机结合起来,与学生的自由自主、欢喜快乐有机结合起来,让基础教育土厚基强、林茂水深,让基础教育内强素质、外树形象,让基础教育光风霁月、海阔天空。到2035年,我们要实现教育现代化,建成教育强国。在这个宏大壮阔的历史进程中,“双减”必将留下鲜明而深刻的印迹,必将写出醒目而精彩的篇章。以县域教师队伍素质帮扶破解阻碍基础教育高质量发展的梗阻问题为了实现到2035年建成教育强国的目标,我们要做的最艰巨的工作是推动实现教育优质均衡发展。中国这么大,如果能实现教育优质均衡,那一定是世界教育史上的伟大奇迹,一定是对人类文明发展的伟大贡献。在20多年的教育帮扶实践中,我对东部、中部、西部地区教育发展的不均衡,对一线、二线、三线、四线城市教育发展的不均衡,对城乡教育发展的不均衡,对县中困境和乡村学校的凋敝,对推动实现教育优质均衡发展的重要性和紧迫性,有着真切的体认。教育均衡的1.0版是解决有与无的问题,让所有的孩子都有学上,学有所教,一个也不能少;教育均衡的2.0版是解决好与差的问题,让所有孩子都能上好学校,享受好的教育,一个都不掉队。1.0版的教育均衡是基本均衡,2.0版的教育均衡是优质均衡。当前,我国教育均衡已经进入优质均衡的2.0版,关键点在于教师队伍建设,特别是县域教师队伍建设。 从长远看,振兴县域教育,必须把输血和造血结合起来,以造血为主;必须把开渠引水与打井生水结合起来,以打井生水为主;必须把外有援军和内有粮草结合起来,以内有粮草为主;必须把应急之策与长远之计结合起来,以长远之计为主。振兴县域教育要做好、做实、做长久,最终一定要归结在为县域学校培养高质量、源源不断、长期稳定的教师队伍上。正是基于这样的思考,在“振兴县域教育保定综合实验项目”进行一年后,河北省保定市人民政府、河北大学、创新人才教育研究会联合创办了河北大学双卓教育学院,并把其功能定位在为县域基础教育培养卓越校长、卓越教师。保定市人民政府提供政策支持和统筹协调,河北大学贡献学科支持和教学保障,创新人才教育研究会组织全国各地的一线名校长、名教师进行实务教学和跟岗教学。以地方政府、高等院校和全国性学术团体的密切合作,形成提升县域教师队伍水平的强大优势和核心竞争力,探索县域教师教育的新路径。目前,河北大学双卓教育学院的第一批600多名学员已入学,开局良好。我们有信心把双卓教育学院这块振兴县域教育的试验田,精心耕耘成振兴县域教育的示范田。 十年树木,百年树人。教育需要的是潜移默化的慢工夫,最需要回归于人、以人为本,最需要着眼长远、夯基厚土,最需要在看不见的地方绵绵用力、久久为功。风物长宜放眼量。从现在到2035年还有12年的时间,只要我们在教师队伍建设特别是薄弱地区教师队伍建设上,有大投入,下大功夫,做好铺垫、打好基础,实现教育优质均衡、建设教育强国的目标就一定能够实现。改变拒绝心态发挥好数智时代新科技对教育回归本源正道的功用 2023年,ChatGPT横空出世,引发了知识界对新技术的广泛讨论,而教育领域对以ChatGPT为代表的深度人工智能更为敏感。毕竟,当人工智能形成的知识更准确、更可靠、更全面、更系统的时候,当人工智能能回答问题、能作文绘图、能提供方案的时候,教育如何办?教师如何当?学生如何学?对这些问题的解答迫在眉睫。 历史潮流浩浩荡荡,科技发展日新月异。教育部门、教育工作者必须直面现实、迎接挑战,在新思路、新格局中,重新定位教育和教师的角色、职能,在新思路、新格局中加强科技与教育的深度融合,让新科技为教育高质量发展加持赋能。就教育特别是基础教育而言,以ChatGPT为标志的深度人工智能在逼迫教育向前、向外看的同时,也促使教育向后、向内看。面对深度人工智能,理性、主动、积极的态度应该是:人工智能能做的事,就让人工智能去做,教师要做人工智能做不了、只有教师才能做的事情。也就是说,人工智能是“外家功夫”,教师是“内家功夫”,新时代的教育应该内外兼修,这样才能如虎添翼。换言之,教育应对深度人工智能等新科技的过程,实际上也是迭代杂糅、返本开新的过程。深度人工智能等新科技有可能倒逼教师回归启蒙养正的本位。教书育人,教书是为了育人;教书是手段,育人是目的。我们目前花费大量精力在做的灌输、背诵、复习等工作,一定会慢慢地移交给深度人工智能等新科技,教师的心思和精力将会集中在激发学生兴趣、教给学生方法、开掘学生想象力和创造力上;集中在启智润心、立德树人上,成为学生的心灵塑造者、行为引导者、智慧开发者和能力培养者。这样的环境和氛围,才有利于产生我们常说的集经师与人师于一身,教导学生为学、为事、为人的“大先生”。 深度人工智能等新科技有可能倒逼师生关系回归爱与尊重的本位。良好的师生关系是良好教育的基石,没有良好的师生关系,教育的大厦只能是沙聚之塔。良好的师生关系是爱与尊重的状态,是以心传心、以心印心的状态,是言传与身教相结合的状态,是大鱼与小鱼“从游”的状态。梅贻琦、潘光旦在《大学一解》一文中说,“学校犹水也,师生犹鱼也,其行动犹游泳也,大鱼前导,小鱼尾随,是从游也,从游既久,其濡染观摩之效,自不求而至,不为而成”。深度人工智能等新科技将教师和学生从机械性、重复性的教学中解放出来,也许能实现师生关系在“从游”中优哉游哉、水到渠成的理想境界。 深度人工智能等新科技有可能倒逼基础教育回归完整教育的本位。长期以来,许多人对基础教育有一种不正确的认识,认为基础教育只是一种过渡教育,其任务就是把学生送进大学。这种过渡教育的认识严重矮化了基础教育。高中生毕业时十八周岁,正好是领取居民身份证的年龄,应该成为能正确履行权利和义务的合格公民。因此,基础教育不是过渡教育,而是完整教育。近百年前,著名教育家、北京师范大学附属中学校长林砺儒先生就提出基础教育是“全人格教育”,正是在“全人格教育”理念的引领下,北京师范大学附属中学培养出了以钱学森、张岱年为代表的一大批杰出人才。今天,深度人工智能等新科技大大提升了学习效率,也许能助力学生德智体美劳全面发展,助力学生形成全人格和大成智慧,助力基础教育回归完整教育本位。理直气壮培养拔尖创新人才是新时代教育发展的新生长点和亮点党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才。”在建设科技强国、教育强国、人才强国的伟大进程中,培养造就拔尖创新人才,势所必至,理有固然。只有培养出大批拔尖创新人才,我们才能自豪地宣称,中国教育不仅有“高原”,而且有“高峰”。着力造就拔尖创新人才,既是教育强国建设的亮点,也是教育高质量发展的标志。“着力造就拔尖创新人才”写进了党的全国代表大会政治报告,这对于拔尖创新人才培养而言,是具有划时代意义的表述。过去,基础教育领域培养拔尖创新人才,总是羞羞答答、遮遮掩掩,今天,总算可以理直气壮、大张旗鼓了;过去,基础教育领域谈论培养拔尖创新人才,总是花大量口舌讲为什么要做,今天,总算可以将主要篇幅用来谈怎么做了。 作为一名从事拔尖创新人才早期培养工作几十年的教育工作者,我认为基础教育领域培养拔尖创新人才,需要系统推进、贯通培养、全面发力、协同联动,在筑牢根基、拓围增量中,奋力开创拔尖创新人才培养的新局面。 一是全社会系统推进。推进拔尖创新人才培养需要政府与社会各界的共识与合力。政府需要把拔尖创新人才培养上升到落实国家战略层面,让各级教育行政部门普遍树立正确的教育公平观、科学人才观和多元化质量观。要加强宣传和引导,转变某些教育工作者和公众的认识误区,充分认识培养拔尖创新人才与教育均衡并非对立的两面,而是有教无类和因材施教的结合,对拔尖人才的早期鉴别并非“掐尖”“抢生源”,从而营造支持学校和区域培养拔尖创新人才的舆论氛围,形成鼓励早出人才、快出人才、出好人才的社会环境。应鼓励高校、学会、智库等机构对拔尖创新人才培养进行科学研究,围绕识别机制、培养重心、价值引领、评价体系、科研保障、生涯干预等核心课题开展持续攻关,并密切参与一线教学、师资培养和政策制定。 二是全链条贯通培养。推进拔尖创新人才培养必须做到战线前移、重心下沉,打破学段边界和校际边界,小学、初中、高中、大学一体化衔接,开放入口,逐步分流,实现贯通化、系统化、开放化培养。培养拔尖创新人才,首先要重视超常教育这一重要途径,强化“拔尖创新人才培养”的类型特征,破除其“将学生分成三六九等”的污名化舆论。建议在各省份选择符合条件的学校开展超常教育试点项目,或者建立专门的超常儿童试点学校,将超常儿童教育纳入特殊教育体系,在学生选拔、评价、升学等方面与普通教育分开,单设门类、单独计算,从而避免把对超常儿童的选拔、培养与“掐尖儿”“拔苗”等混淆;建议允许条件成熟的超常教育试点学校打造自身的绿色通道,联通幼儿园、小学、初中、高中等各学段,并与相关大学/科研院所建立联合培养机制;同时,进一步改革高考招生制度,使超常儿童能够通过合适的通道升入高等学府。其次,要在继承历史成就的基础上加强基础教育与高等教育的一体化衔接。从基础教育阶段来看,1985年,中国人民大学附属中学、北京市第八中学等全国少数省市试点学校获批开设中学超常儿童实验班。2010年,这两所学校获批成立“探索拔尖创新人才培养模式试验项目基地”,基本形成小、初、高相衔接的拔尖创新人才早期培养体系。2023年3月23日,教育部召开新闻发布会,高等教育司副司长武世兴在谈及落实拔尖学生培养相关政策的举措时表示,将开辟从基础教育到高等教育一体化的识别、选拔、培养、升学的通道,让有天分、有潜力、有志趣的学生能够脱颖而出。基础教育界的成就,加上高等教育界的态度,新时代的拔尖创新人才培养未来可期。 三是全要素共同发力。教育的三大要素是教育者、受教育者和教育影响。从教育者角度看,应加强针对拔尖创新人才早期识别和培养的师资培训,在职前师范教育、职后继续教育中增设相关板块,并结合国内外前沿科研成果不断优化升级。从受教育者角度看,可通过政策支持、资金保障等方式扫清识别与培养“潜在的拔尖创新人才”的障碍,尤其是要为中西部欠发达地区颁布特别举措,探索建立以高水平学校支持、中西部高校为重要参与方的协同培养联合体,建立有效的识别和支持体系。从教育影响的角度看,要针对拔尖创新人才培养的特点,参考多元智能理论等,更新教育内容、教育方法和教育手段,对拔尖创新人才进行追踪研究,深入探索拔尖创新人才的成长规律。 四是全领域协同联动。拔尖创新人才培养涉及学校、家庭、企业、科研院所等,必须统筹资源,整合各方力量,加强系统谋划设计,实现全领域协同联动。要高度重视基础学科拔尖创新人才培养,打通学段之间、产学研之间的阻隔,推进人才培养机制的联通。要深入研究拔尖创新人才识别、选拔、培养、管理、评价、追踪和改进提升的一体化模式,坚持系统性、整体性、协同性思维,推动教育、科技、人才三大战略统筹实施,推动创新链、产业链、人才链深度融合,促进拔尖创新人才的不断涌现。 总而言之,将“双减”政策落实到位、促进教育优质均衡、让新科技加持赋能、着力培养拔尖创新人才,是新时代基础教育高质量发展的“四梁八柱”。这“四梁八柱”立定了,基础教育必将建起广厦千万间,风雨不动安如山;这“四梁八柱”立好了,基础教育未来可期,一定能够在教育强国建设中大有作为,建功立业。 作者刘彭芝系中央文史研究馆馆员,国家教育咨询委员会委员,创新人才教育研究会会长,国家乡村振兴重点帮扶县教育人才“组团式”帮扶工作专家顾问委员会主任委员,中国人民大学关工委常务副主任,人大附中联合总校名誉校长、人大附中名誉校长,教授、特级教师。【版权声明】文章来源:中国基础教育,转载于中小学校长论坛,如涉版权,请联系删除。