教育评价改革事关教育发展方向,事关建设教育强国成败。2020年中共中央、国务院印发《深化新时代教育评价改革总体方案》(简称《总体方案》),这是新中国第一个关于教育评价系统性改革的文件。2023年5月,习近平总书记在中共中央政治局第五次集体学习时再次强调,“要在全社会树立科学的人才观、成才观、教育观,加快扭转教育功利化倾向,形成健康的教育环境和生态”“要紧扣建设教育强国目标,深化新时代教育评价改革,构建多元主体参与、符合我国实际、具有世界水平的教育评价体系”。
教育评价改革落实与未来发展
《总体方案》印发以来,各地重视政策引导、专业引领和典型引路,以评价改革重点任务为抓手,发挥基层首创精神,推动本地区本单位教育评价改革发生显著性变化,形成了一批典型经验,如上海市义务教育学业质量“绿色指标”和评价数据的“无感采集”、湖南省长沙市基础教育的“增值评价”、清华大学的体育评价改革等。根据第三方的监测结果,在教育评价改革中,“十不得一严禁”等负面清单管理取得明显成效,违规事项总体呈明显下降态势。“中国特色教育评价体系”“多元评价”“分类评价”等价值理念得到社会的广泛认可。
按照《总体方案》要求,到2035年基本形成“富有时代特征、彰显中国特色、体现世界水平的教育评价体系”,需要在教育评价的理念、理论、主体、对象、内容、标准、方法、技术、制度、文化等方面进行体系性重塑。“富有时代特征”就是要体现新时代的人才观、成才观、教育观,特别是针对当下和未来的人才需求、拔尖创新人才的成长规律、教书育人的本质和规律,校准教育评价的发展方向。“彰显中国特色”就是要体现中国教育评价的主体性、原创性,特别是发掘我国科学评价的典型经验,彰显中国教育评价的人文精神传统。“体现世界水平”就是要提高中国教育评价理论和评价标准的国际影响力,特别是要提出诸如“CIPP”(背景—投入—过程—结果)评价模型和“PISA”学生素养评价等先进评价理念和项目,能够引领国际教育评价方向,影响各国教育政策制定。
面向2035年建成教育强国的战略目标,推进新时代教育评价改革还有一些需要啃的“硬骨头”,这些方面的探索和突破将撬动教育评价改革取得更为明显的实质性进展。
面向教育强国建设推进教育评价改革的难点与探索
(一)学生评价:怎样的评价可以促进创新素养发展
从19世纪末以来,国际教育评价理论和实践经历了“测量、描述、判断和协商”四次演进和迭代。从教育评价的历史来看,智力测验、认知能力评价相对比较成熟,由此形成了科学主义、管理主义的评价模式,使得“唯分数”等简单化、单一化的量化评价长期占据主导地位。在学生德智体美劳的发展评价中,非认知能力由于难以量化和客观测量而长期受到忽视。在建设教育强国的时代背景下,我们究竟要培养什么样的人,未来对人才素养的要求是什么,生成式人工智能对人才培养的挑战是什么,这些问题的答案都指向在未来社会中将居于更加重要位置的“非认知能力、社会情感能力、创新素养、高阶思维和人文素养”,这些才是“人之为人”而无法完全被机器取代的素质,而新时代教育评价改革正是要回归人的本质。在新时代教育评价改革中,“幸福比成功更重要,素质比分数更重要,成人比成才更重要”。[1] 推进教育评价改革,需要更加重视多元、多维、全面、高级的学生素养评价。
一是更重视非认知能力评价。在数字时代和创新时代,社会情感能力、想象力、学习兴趣和幸福感变得更加重要。对学生的评价不仅要关注学习结果(学得怎么样),更要重视学习状态(学得快不快乐、轻不轻松)。“上海市中小学生学业质量绿色指标”关注学业成绩,更关注学习成本(学习投入和时间);关注学业质量,更关注学生快乐成长、全面发展的过程。山东省淄博市淄川区的初中生“学习兴趣指数评价”,关注学生的学习状态、学习动力和学习体验。
二是更重视高级能力评价。从PISA等国际大规模教育评价来看,国际社会越来越重视学习素养、创新素养、高阶思维、批判性思维、分析和解决问题能力等高级能力评价。在实践探索方面,北京大学附属小学的“学生创新素养评价体系”从创新意识、创新思维、创新能力、创新精神、创新人格5个维度构建了25个观测点,推动小学阶段拔尖创新人才早期培养走向深入。
三是更重视影响因素的复杂性。学生发展受到多种因素影响,学业水平和非学业水平是各种力量相互作用的结果。浙江省温州市的“初中绿色增值评价”从学业和非学业发展(学生品德发展、身心健康和学习生活幸福)两个方面考查学生学习结果和增值,特别注意考查前期学习基础、家庭背景、学校水平等因素对增值结果的影响。
四是更重视评价形式的多样性。评价形式对于创新素养的表现和观测极为重要。山东省德州市低年级的“非纸笔绿色测评框架”采用“游戏闯关、模块游考、实践活动和项目学习”等形式,克服书面测评过于强调知识记忆的局限,对学生的想象力、创造力等素养开展表现性评价。
(二)教师评价:怎样的评价可以促进教师潜心育人
教师评价本质上是对教师的专业实践进行评价,属于实践评价范畴。教师的专业实践不仅是在实践中发展自我,更是为学生的学习和发展提供专门性服务。[2] 20世纪80年代之后,我国教师评价虽几经改革,但仍以奖惩功能为主,主要为教师聘用、晋升、加薪、选拔等提供依据,教师评价的发展性功能未能真正落实。[3]“教书育人”是一种道德实践,对教师业绩的评价不能等同于企业的绩效管理。实证研究表明,问责式教师评价对教师专业表现影响的直接效应不显著,甚至产生显著的负向影响;而发展性教师评价对教师专业表现的总效应、直接效应和间接效应皆为显著正向影响。[4] 新时代教师评价改革应更强调“育人”职责而非问责,更重视分类评价、多元评价、发展性评价、表现性评价和长周期评价。
一是更重视教师的道德实践和情感付出。教师的胜任力、工作业绩和效果不仅体现在知识传授上,更体现在道德引领上。在教师评价改革中,师德师风、教师情感劳动和学生工作尽管难以量化和评价,但最能体现教师工作的本质特征,一些学校和地区已将其纳入教师评价体系。中南大学的教师评价将教学竞赛获奖、指导学生竞赛获奖等纳入职称评聘和教学奖项申报成果要求,教育教学、学生工作与科研成果同等重要。
二是更重视发展性评价。发展性评价可以激发教师内在的专业力量,培育教育家精神。山东省日照第一中学的“发展性教师评价”制定了多元化的评价指标,不同系列教师的评价内容和权重各有侧重,考核内容涵盖学校各项工作,评价主体多元化,并将发展性评价与总结性评价结合起来,以教师评价提升教师幸福感。
三是更重视表现性评价。教师评价特别强调教学情境,评价的是教师的实践智慧,这就需要超越传统纸笔测验,通过观察教师的专业实践来获取评价信息,而评价者则需要运用丰富的实践智慧进行专业判断。[5] 表现性评价不是只关注优质课比赛等具有“可看性”的专业实践,而是重在日常行为表现及其产生的育人效果。经合组织(OECD)发起的“全球教学洞察”(GTI)项目,以视频研究的形式收集并观察分析了来自8个不同国家和地区教师的课堂录像,用以考查教师的教学质量,我国上海市也参与了这一项目。
四是更重视长周期评价。教育效果具有滞后性、集体性、复杂性,教师对学生发展的影响通常在多年后才充分显现,教师以集体合力的方式对学生施加影响,而学生发展也受到同伴、家庭、社会等因素的影响。立竿见影的问责式评价难以适应教师工作的特殊性。广东省深圳市龙华区教科院附属外国语学校的“生态型教师评价体系”以教师发展档案为载体,构建过程性多维度评价体系,实行个体多元的发展性评价制度,让评价主体多元化,评价对象个性化,评价方向多维化,变定性为过程性,实现绿色生态型评价。
(三)学校评价:怎样的评价可以提升学习体验和社会贡献
学校是资源依赖型组织,外部环境和外部评价对办学行为产生重大影响。评价学校效能的主要指标包括教育目标达成、教育输入与输出以及关键人群满意度等。[6] 相应地,学校评价的形式主要有政治学视域下的政府督导评估、经济学视域下的学校绩效评价和社会学视域下的家长满意度评价。我国学校评价长期以政府单一主体评价为主,看重以分数为主的升学率竞争评价。由于学校评价结果与教育资源配置挂钩,学校极为重视政府的绩效评价和学校排名等声誉评价,而学校的自我评价以及以学生为中心的评价相对较弱,在一定程度上忽视学生的就读体验和身心全面发展,学生毕业后对母校的归属感和认同感不强。学校评价应增强学校自主发展的能力,引导学校更加重视以学生发展为中心的立德树人实践,更加强调人才培养和知识创造的社会贡献。
一是更重视以学生发展为中心的评价。教育质量应该首先是指学生的发展质量,即学生在整个学习历程中所学的“东西”(所知、所能做的及其态度)是衡量教育质量的核心标准。[7] 学校办学规模扩大、条件设施改善、办学经费增长不代表办学水平的同步提高,而学生的就读体验和学习收获才能真正反映学校的办学质量。但“以学生发展为中心”不能等同于“以学生满意度为中心”,“学生评教”也可能使教师为“讨好”学生而降低学业标准和要求,“以学生发展为中心”的核心是要促进学生发展。
二是更重视特色化和分类评价。学校评价最终要增强学校发展的内生动力,形成学校对于教育发展规律的独特认识和创造性实践。学校同质化和过度追求排名是对自身特色和发展定位不清所致。有学者构建了学校特色发展测评模型,包括文化特色、课程特色、组织管理和质量改进4个维度15个指标。[8] 学校的分类发展和分类评价有助于推动学校特色化发展。
三是更重视发展性和增值性评价。增值评价以学校教育活动对学生预期成绩的增值为教育评价标准,用来判定学校对学生发展的影响,是一种绿色升学率理念下的发展性学校评价模式。[9] 山东省济南市“区域初中学生综合素质增值评价”从学校办学质量和学生发展质量两个维度建立增值评价体系,采用多水平线性分位数回归模型,分析学生增值发展状况和学校办学水平。
四是更重视学校和学科的社会贡献。西方主导的大学排名和学科排名追求的是形式评价,中国特色的教育评价体系要体现我国农林、国防、师范和人文社科等专业的特点。东北师范大学在教师教育学科领域人才评价中,将优秀教学案例、课程标准制定及国家考试命题等作为特色指标,引导高水平科研成果向教学内容转化,推动教研成果示范与推广。
(四)政府评价:怎样的评价可以提升政府的“元治理”能力
新时代教育评价改革涉及学生、教师和学校三个教育系统内部主体,以及政府和社会两个外部主体。相对而言,教育系统内部的改革推进比较容易,系统外部的改革则推进艰难。对部分省份教育评价改革的政策文本分析发现,政策关注点聚焦学生、教师和学校评价,对政府评价和用人评价不够重视,政策的可操作性有待提高。[10] 总体而言,教育评价具有高度社会敏感性、高度依赖社会环境等特点,因而每项改革都可能会引起相关利益主体的极大关注。改进党委和政府评价需要更加重视党委统筹能力、政府履行教育职责、区域教育结构型质量评价,并准确把握教育评价的敏感因子。
一是更重视党委统筹能力评价。党委和政府既是推动评价改革的主体,又是评价改革的对象,其统筹能力体现了推进评价改革的力度和成效。从国家和省级层面来看,各级党委教育工作领导小组作为议事协调机构,可以统筹教育、发改、财政、编办、宣传、人社等部门的力量推进评价改革,但在人才选聘和专业技术人员评聘等领域,教育评价改革与部门利益或政策还不完全适应。教育系统外部的评价改革需要充分发挥党委统揽全局和统筹协调的能力,提升党委对各类评价的“元治理”能力。
二是更重视政府履行教育职责评价。2017年国务院办公厅印发《对省级人民政府履行教育职责的评价办法》,此后每年由国务院教育督导办公室组织对省级政府加强党的领导、优先发展教育等职责的督导评估。开展政府履行教育职责评价,应对评价内容或事项进行分类设置评价指标,包括对政府统筹推进教育工作表现的质性评价、区域教育发展水平的量化评价、政府教育工作进步程度的肯定评价、政府教育工作的社会满意度评价等。[11]
三是更重视区域教育的结构型质量评价。在教育强国建设背景下,各级党委和政府的主要教育责任是构建区域高质量教育体系。浙江省“区域教育发展结构型质量评价”着力破解“唯分数、唯升学”的“学业成绩政绩化”,构建区域教育新生态。结构型质量体现在区域内教育资源配置的科学性与合理性、各类教育的协调发展以及发展状态的可持续性,包括学校的规划布局、教育发展的均衡状态、师资队伍建设与经费使用等方面。
四是更重视把握区域评价改革的敏感因子。不同区域在不同阶段推进教育评价改革面临不同的关键制约因素。对于缺少政策支持的区域,应着力构建教育评价改革“特区”政策。对于缺少评价理论和技术支持的区域,应着力发挥科研的支撑引领作用,研发评价工具。对于缺少专业人才支撑的区域,应推进高校设置教育评价专业,并加强教师评价素养的专业培训。2023年山东省依托山东师范大学、山东省教育科学研究院等单位共同组建山东省教育评价研究中心,为区域深化新时代教育评价改革夯实理论与实践支撑。
(五)用人评价:怎样的评价可以促进人岗相适
依据信号理论和筛选理论,在用人单位看来,教育标签(学历文凭)是一种潜在生产力的信号,可以反映其需要的培训成本的高低。因此,高学历者更易获得排名靠前的机会,也更容易被用人单位选聘。然而在现实中,高学历并不一定具有较高的职业胜任力,在具体工作岗位中经常出现教育错配或人岗不相适应的情况。过度教育与教育不足会降低劳动者的工作满意度,过度教育具有工资惩罚效应,教育不足具有工资溢价效应。[12] 改进社会选人用人评价应更加重视职业胜任力评价、人才发展潜能评价、人岗相适评价,以及大数据在人才评价中的应用。
一是更重视胜任力评价。胜任力通常包括外显胜任力(知识、技能等)和内隐胜任力(价值观、能力和特质等),前者是基准性特征,是对胜任者的基本素质要求;而后者是鉴别性特征,是区分优异者和平平者的关键因素。[13] 用人单位实际上更看重求职者的内隐胜任力。西南大学在引育人才、促进人岗相适方面,结合学院、学科特色“一院一策”引育新人,如农学与生物科技学院就针对“农科”特色,对新进教师进行为期4年的较长周期评价,避免短期评价功利化。
二是更重视人才发展潜能评价。促进人岗相适、实现事业发展与个人发展同步提高,是用人单位提高人才使用效率的着力点。对人才发展的潜能和可持续性的评价,建立在对人才综合素质的评价基础之上。美国教育考试服务中心(ETS)的研究生招生“个人潜能指标测评”(PPI),就涵盖了知识与创新能力、沟通技能、团队能力等6个一级指标,以便更加全面综合地了解学生的个人品质。[14] 中山大学在制定人才引进条件时,综合考查引进人才的学术水平和发展潜能,不把SCI论文相关指标、人才“帽子”等作为引进和聘用的前置条件。
三是更重视依据岗位标准选聘人才。科学设置教师岗位是做好教师聘任制的首要问题。2023年山东省发布的《关于进一步深化中小学教师职称评聘改革的意见》就提出,在中小学教师评价中,德育、体育、美育、劳动教育、科学、心理健康教师可单列指标、单设学科组评审,幼儿园教师评价突出保教实践,教研员评价突出教育教学研究实效。在中小学教师岗位设置和聘用方面,一些地方也在探索“高评低聘、低评高聘”来解决人岗相适的问题。
四是更重视大数据在用人评价中的应用。国内外大量研究表明,大数据技术赋能的人才招聘能帮助用人单位对大批量人才信息快速筛选,特别有助于提升人才内隐特征的甄别效率,促进人才与用人单位间的双向沟通效能。北京市海淀区建立了“干部教师交流数据分析平台”,平台导入所有义务教育学校教师职称、年龄以及骨干教师学科分布等教师队伍情况,匹配学校学生学业成绩、中考增值评价和监测等,按需开展精准交流和校际联动。
结语
教育评价改革是教育强国建设的“牛鼻子”,《总体方案》作为新中国成立以来第一份关于教育评价系统性改革的文件,将教育评价改革置于前所未有的重要位置。深入推进新时代教育评价改革,不仅要聚焦学生评价、教师评价、学校评价、政府评价和用人评价五大领域久久为功,而且要构建教育评价的专业化支撑体系,在教育评价理论研究、教育评价专业人才培养、评价工具研发以及大数据、人工智能赋能教育评价改革等配套领域取得实质性突破。《总体方案》发布3年来,各地各校探索推进落实落地,已经构建起评价改革的四梁八柱,并且在操作性强的改革举措上建章立制、深入实施,但在系统性强、协调难度大、利害攸关和传统观念牢固的领域,还有一些难啃的“硬骨头”,这些领域的突破和创新将带来教育评价改革的格局性变化。
注释
[1] 朱永新. 把教育常识变成社会共识[J]. 中国教育学刊,2023(04):1.
[2] 周文叶. 试论“学为中心”的教师评价框架[J]. 教育研究,2021,42(07):150-159.
[3] 申继亮,孙炳海. 教师评价内容体系之重建[J]. 华东师范大学学报(教育科学版),2008,26(2):38-43.
[4] 刘伟,李琼. 怎样的评价可以促进教师潜心育人:来自中小学教师专业表现的实证证据[J]. 教师教育研究,2022,34(01):49-56.
[5] 周文叶. 教师评价:评什么和怎么评——访斯坦福大学李·舒尔曼教授[J]. 全球教育展望,2020,49(12):3-12.
[6] 李永生. 学校效能评价:一种评估中小学工作绩效的工具[J]. 教育研究,2013,34(07):105-115.
[7] 陈玉琨. 高等教育质量保障体系概论[M]. 北京:北京师范大学出版社,2004:59.
[8] 范涌峰,宋乃庆. 学校特色发展测评模型构建研究[J]. 华东师范大学学报(教育科学版),2018,36(02):68-78+155-156.
[9] 边玉芳,林志红. 增值评价:一种绿色升学率理念下的学校评价模式[J]. 北京师范大学学报(社会科学版),2007(06):11-18.
[10] 刘国瑞,张怡. 省级政府履行新时代教育评价改革职责情况分析——基于10省份教育评价政策文本的研究[J]. 沈阳师范大学学报(教育科学版),2023,2(02):92-99.
[11] 韦兰明,覃淮宇. 研制政府履行教育职责评价指标的依据、原则及策略[J]. 上海教育评估研究,2022,11(02):1-6.
[12] 李根丽,周泰云. 教育错配会影响工作满意度吗——机制分析与实证检验[J]. 山西财经大学学报,2021,43(08):30-42.
[13] 彭本红,陶友青,邓瑾. 大学高层次人才胜任力的评价[J]. 统计与决策,2007(15):143-145.
[14] 陈瑶,邵福球,高进军. 美国研究生招生的新评价手段——“个人潜能指标测评”(PPI)评介[J]. 学位与研究生教育,2010(03):74-77.