教育测量理论与中考命题.ppt
《教育测量理论与中考命题.ppt》由会员分享,可在线阅读,更多相关《教育测量理论与中考命题.ppt(106页珍藏版)》请在三一文库上搜索。
1、教育测量理论 与中考命题,黄 宪 2016年10月30日,个人简介 中学正高级教师、广东省特级教师、广州市优秀专家 广州市教育局教学研究室原主任。现任广州市人民政府督学、全国中小学教育督导评估专家、广州教育学会副会长、广州市特级教师协会会长、广东省教育评估协会副会长、广东省心理学会教育测量与考试研究院院长 兼任华南师范大学心理学院应用心理学/计量心理学专业硕士研究生导师,广州市首批教育名家工作室主持人,广东省、广州市新一轮“百千万人才培养工程”教育专家培养对象实践导师,一、与考试相关的教育测量理论,(一)考试的性质与特点 (二)试题编制技术 (三)常见题型的命制 二、关于中考命题的若干思考 (
2、一)初中毕业生学业考试的性质与功能 (二)中考及其命题的指导思想和价值取向 (三)中考试题编制值得注意的几个问题,一、与考试相关的教育测量理论,(一)考试的性质与特点,1、考试的性质 考试是一种心理测量,是心理测量在教育中的应用。 心理测量是依据心理学、教育学的理论,使用测验对人的心理品质(非物质性、内隐性、相对稳定性)进行定量描述的活动。 测验是由一个个精心设计、精心编排、被称为“题目”的行为刺激组成的测量工具。 测量的目的是将人的心理品质按水平高低定位在“测验”的数字系统上。,2、考试的类型 (1) 常模参照考试以个体在团体中的相对地位评价个体发展水平的考试。 (2) 标准参照考试以个体是
3、否达到某一客观的标准,评价个体发展水平的考试。 (3)潜力参照考试以个体是否达到其应该达到的水平评价个体现已达到水平的考试 (4)教学目标诊断考试以诊断学生在各个学习目标上学习缺陷和困难为目的的教育考试。 (5)认知诊断考试深入到个体作答的认知过程,以评价个体各种认知属性发展水平为目的的教育考试。,3、考试的特点 (1)间接性:作为一种心理测量的考试,心理测量所用方法是间接的。 (2)抽样性:测验考卷只能是某一学科领域知识能力考题的一个样本。虽然样本力求能代表总体,但样本与总体相比总存在抽样误差。 (3)误差存在的普遍性与严重性:作为一种心理测量的考试,其误差到处存在而且远比其他测量严重。考试
4、研究的主要任务之一就是研究如何将考试的误差控制在我们可容忍的范围内。,4、考试的误差 (1)定义:在考试过程中由那些与考试目的无关的变化因素所产生的测量效应。 (2)类型及特点: 随机误差:与考试目的无关的偶然因素引起的、不易控制的测量效应。(特点:方向、大小随机变化,导致考试结果不一致、不稳定) 系统误差:由与考试目的无关的因素引起的一种恒定而有规律的测量效应。(特点: 稳定地存在于每次测量之中,但却导致考试结果不准确),(3)考试误差形成的原因 所测品质的特殊性与其他测量对象不同,考试所测量的心理品质内隐、抽象,只是相对稳定,造成对目标认识不清晰,测量结果波动易变,导致误差。 编制的测验质
5、量不高:人的外显行为与人的心理品质只具备相关关系,可能导致试题所测外显行为不是欲测心理品质的代表性行为。测验项目只“刺激”出了欲测心理品质的一部分行为,标准答案欠标准甚至出错,评分标准欠刚性。 施测过程和施测环境安排控制不好:施测过程没有统一要求;测试指导语没有统一版本;作答起始时间和长短不统一;测试时的内外环境令被试不能集中精力;测试过程失控、纪律混乱。,主试的原因:主试对所测心理品质的理解有误;主试实施的程序有误;评分标准掌握不准。 被试的原因:被试情绪不稳定,波动起伏,导致误差;被试未掌握正确作答方法,致使作答不能代表真实水平;被试随机猜测,致使评价出现误差;被试舞弊,致使评价出现误差。
6、,(二)试题编制技术,1、考试信度评价与试题编制 信度代表的是测验考试的可靠性程度即考试结果分数的稳定性。 信度本质: 是考试随机误差的描写指标,信度越高,说明随机误差越小,考试的结果越可靠,越稳定。 通常考试测验的信度需要达到0.8以上,测验考试的结果才算作比较可靠的。,11,提高考试信度的试题编制技术 (1) 维持测题的同质性; (2) 控制题目难度:全卷试题难度呈正态分布; (3) 努力提高题目区分度; (4) 保持足够的题量; (5) 准确估计考生作答时间; (6) 控制评分误差,制定好尽量刚性的评分标准(解释描述性评分标准、答例罗列性评分标准)。,2、考试效度评价与试题编制 效度代表
7、测验考试的结果的有效程度,即考试结果分数的准确性,实际所测的东西与我们预计想测的东西是否一致。 效度本质: 效度是考试随机误差与系统误差总和的描写指标。 信效度关系:一个考试,信度高是效度高的必要而非充分条件。 效度评价方法 从内容角度评价: 用双向细目表评价 从实际表现角度评价: 因素分析方法(目的是把一些具有错综复杂关系的因素归结为数量较少的几个综合因素或称共同因素,并以此作为测验所测的特质对测验分数做出的解释)。,13,提高考试效度的试题编制技术 (1)努力使用好能提高测验信度的各种命题技术 (2)认真做好试题内容目标分析,保证所命试题内容确实能代表考试内容领域 (3)命题以能力立意,要
8、能真正测到所要测的能力 (4) 控制试题作答发散程度 (5) 防止试题出现测量偏差,即非能力因素导致的“项目功能差异(DIF)”,项目功能差异是指不同群体对同一题目的答对概率(或得分率)不同,即不同群体在同一题目上得分存在差异。 造成项目功能差异的原因可能是群体间本身能力水平存在差异引起,称为良性DIF;也可能群体本身能力水平不存在差异而由于其它因素的差异(如性别、种族、地域、风俗习惯方面差异)所致,则称为不良DIF ,此时我们称题目存在测量偏差。 必须关注的是不良DIF ,即测量偏差。测量存在偏差,意味着测量不公平,不仅是效度受影响,还可能引起社会性问题。,测量偏差防止方法 命题时要特别注意
9、测量对象中的各类弱势群体在所命试题上的感受和作答表现。尽量少出或不出有可能存在文化、宗教、性别、区域、职业歧视或敏感内容的试题。 可以用统计方法侦查是否有题目存在“项目功能差异(DIF)”,若有,进一步分析是否良性DIF ,以决定取舍。,通过率: 难度:,17,两者都说明题目的难易程度,难度或通过率的值越高,说明题目越简单,3、试题难度评价与试题编制,例:10名学生在某道满分为10分的题目上的得分分别为2、5、9、10、4、8、7、5、3、0,18,控制题目难度的试题编制技术 难度控制目标:大多数试题对全体考生呈中等难度分布,选拔考试视选拔比例适度调整。 难度控制技术: (1) 准确区分各种测
10、量任务的难度差別; (2) 了解中等水平考生能力行为特点 ; (3) 选择题可以通过调整错误选项的迷惑力调整难度。,20,说明题目区分得高分的学生与得低分的学生的能力(就是高分组与低分组之间的差异),4、试题区分度评价与试题编制,区分度测验试题能将高低水平被试准确区分的能力。(影响总分离散程度与测验信度),提高试题区分度的试题编制技术 (1) 控制好试题难度 (2) 保证试题所测心理品质与全卷的一致性 (3) 试题答案无歧义 (4) 语言准确规范,作答要求明确 (5) 选择题可以通过选项分析帮助寻找区分度不高原因,高低分组法选项分析方法示例,分 组,A,B*,C,D,低分组,高分组,合 计,0
11、.15,0.20,0.175,0.50,0.40,0.45,0.10,0.10,0.10,0.25,0.30,0.275,评价:本题难度0.45合适,区分度0.10偏低。 C选项无差异且诱惑力偏低,B*选项差异太小。,小结,命题者可以通过各种命题技术提高考试质量。具体途径有: 通过控制测量随机误差提高考试信度; 通过控制测量系统误差提高考试效度; 通过控制试题难度和提高试题区分度提高试卷整体质量。,5、试题编制共同要求 (1)要注意内容的科学性,不应编写出内容有科学性错误的试题。 (2)注意用词和用语的准确性、不能模棱两可、含糊不清。 (3)试题向学生提供的信息要完整,不要片面追求语言简洁。否
12、则会导致学生误解题目考查意图。 (4)试题设问既要指向明确,又要留有作答空间。设问指向不明确可能导致学生不知道向哪个方向去作答。留有作答空间可以鼓励学生创新思维、展现能力。,(5)要有公认的正确答案,不能出理论界还有争议的试题。 (6)要在大纲要求的能力层次和内容范围内出题,不要超越大纲。 (7)要真正体现所要求测量的性能,特别是在认知目标层次上,不要将考高层次能力的试题出成了考记忆或简单应用层次的试题。 (8)防止命制出产生测量偏差(不良DIF)的试题。 (9)题目编好后,应该给出参考答案和评分规则供阅卷评分时参考。对于非客观性试题,这项工作就有一定的难度,因为非客观题无“标准”答案,非客观
13、题的评分也就很难做到完全准确客观。,(10)为此要求命题人员在为非客观题制定参考答案和评分规则时,一定要作认真的思考,要尽量做到“准确”和“客观”。在做参考答案时,首先要保证所做答案是正确的,同时要尽量全面。其次还要考虑到其它可能产生的作答内容和形式,区别出其真伪。 (11)评分规则应尽量分步给分,给分尽量不要有伸缩余地。论述题不要简单地采用选点给分的评分方法。这种评分方法易造成低层次考生采用“漫天撒网”方式提供答句,整个作答无中心、无逻辑,甚至还有错误,结果还能得高分甚至满分。,(12)要重视审题 试题内容是否健康、科学,包括提供的附属材料、案例内容是否健康是否适应时代发展要求。 试题语言是
14、否规范、确切,设问是否清楚,会不会引起误解。 选择题的错误选项是否有效,选项用词有无暗示作用。 客观题的正确答案是否正确、唯一,非客观题的参考答案是否全面、正确。有未考虑到其它可能的正确答案。,非客观题的评分规则是否做到尽量客观细致,是否考虑到了整体思维逻辑的正确性。 所用题型是否规范,是否合符本测验题型的规格要求。 试题各项属性是否符合命题计划要求,特别是能力目标定位是否符合要求。 审题还要做整卷审核;整卷审核重在整卷结构审核,主要包括:内容结构 、能力结构、题型结构、难度结构、评分系统。,6、命题双向细目表的编制,考试命题双向细目表是一种考查目标(能力)和考查内容之间的关联表。 编制考试命
15、题双向细目表,是命题工作的一个重要环节。 双向细目表可以使命题工作避免盲目性而具有计划性;使命题者明确测验的目标,把握试题的比例与份量,提高命题的效率和质量。同时,它对于审查试题的效度也有重要的指导意义。,命题双向细目表具有三个要素:考查目标、考查内容以及考查目标与考查内容的比例。 一般地,双向细目表的纵向列出的各项是要考查的内容即知识点,横向列出的各项是要考查的能力,或说是在认知行为上要达到的水平,在知识与能力共同确定的方格内是考题分数所占的比例。 表中所列的各种能力水平的依据,一般是美国教育学家布鲁姆关于教学认知目标所分为的六个层次,即识记、理解、应用、分析、综合和评价。这六个层次是相互区
16、别而又相互联系的递进的关系。,(1)反映测验内容与测验目标关系的双向细目表,(2)反映测验内容与测验目标、题型之间关系的双向细目表,(3)反映题型与难度、测验目标之间关系的双向细目表,(4)反映题型与难度、检查内容之间关系的双向细目表,该表可以体现题型数量、难易度、测验内容的分配问题。优点是试题取样代表性高,试题难易程度也可以作适当控制,表中数据容易分配。局限性是未能反映测验目标。,(三)常见题型的命制,1. 选择题编制 题干意义要完整、陈述要简单明确 尽可能将各选项的共同用词放在题干中 正确选项不可有歧义 迷惑选项应来源于学生实际错误 迷惑选项不要使用“绝对、总是、从未、绝无、唯一”等词汇,
17、避免暗示学生排除选择 正、误选项排列不要形成规律,2. 判断说明题编制 每一题只能包括一个重要概念。 答案应该无争议 叙述简单明了 避免使用有暗示作用的词汇 避免使用否定词,特别不要用双重否定 正误比例基本应对等,3. 简答题编制 一题一个答案,且答案简短而具体。 一般使用直接疑问句编写试题。 不宜直接从教材上原文抄写试题。 要求考生回答的应该是有关课程的重要概念,而不应是琐碎知识。,4. 论述题编制 要求考生论述的问题应该是要求考生去说明、认识一些实质性东西的问题,并且需要考生在综合分析教材内容基础上才能获得结论的问题,不应是教材或参考材料内容的简单再现。 试题的表述要明确、完整,既要让考生
18、明白命题者的发问指向,又要留有让考生发挥的余地。,思想品德题:阅读下表,回答问题。 某学校中学生消费维权现状,(1)表中数据反映了该校中学生消费维权的什么特点? (2)根据上述中学生消费维权的特点,请你为依法维护中学生消费者的合法权益提出两条建议。,5. 案例分析题编制 所选案例应确实是实际生活中会发生的 应是考生利用所学知识和已有能力确实可以得出结论的问题。 应该是有正确结论的案例。理论界都还有争议的问题不宜作为考题材料,除非评价的不是结论,而是得出结论的理由。,数学题: 某城市居民用水实行阶梯收费,每户每月用水量如果未超过20吨,按每吨元收费;每户每月用水量如果超过20吨,未超过的部分仍按
19、每吨元收费,超过的部分则按每吨元收费设某户每月用水量为x吨,应收水费为y元 (1)分别写出每月用水量未超过20吨和超过20吨时,y与x间的函数关系式; (2)若该城市某户5月份水费平均为每吨元,求该户5月份用水多少吨?,附:布鲁姆教学目标分类理论对能力命题的启示,命题共同要求第七条:要真正体现所要求测量的性能,特别是在认知目标层次上,不要将考高层次能力的试题出成了考记忆或应用层次的试题。 如何命题,才能命出准确考核各种能力的试题呢?布鲁姆的认知目标分类理论对我们会有所启示。,布鲁姆教学目标分类理论简介,美国教育学家布卢姆(1956)把教学目标分为三大领域:认知领域、情感领域、动作技能领域。其中
20、认知领域的教学目标分为6个子目标即:知识、理解、应用、分析、综合、评价。 六个子目标从“知识”开始到“评价”是层层递进的。除“应用”层次外,每个子目标又继续被分为2或3个亚层次。 布鲁姆教学目标分类所有层次都有严格定义,是教育目标分类方法中最受教师欢迎的一种。,布卢姆去世后,安德森等经过长期的酝酿于2001年完成了对布卢姆教育目标分类理论的修订,内容主要是两个方面。 把知识部分细化为事实性知识、概念性知识、程序性知识和元认知知识。(元认知是指个体对自身认知特性的认识) 把认知领域教学目标中原来的综合改为创造并作为最高的考核技能。 学习和理解布卢姆认知目标分类理论下对各个目标层次的各种具体表述,
21、有利于启发我们命制出准确考核各种预定能力的试题。,A 知识目标层次表述,1、陈述有关知识 2、陈述图表中标准表示手法和符号的知识 3、用说出特征、性质或关系的方法来界说技术术语 4、回忆某定义 5、识别某特殊作品 6、知道某些资料 7、辩认某些字母符号 8、区分和辩别各种形式和要素 9、识别作某研究时所需掌握的术语和单词的定义或意义的能力,提醒: 通常知识的考核多为事实性知识、概念性知识两类,而忽略了对程序性知识和元认知知识的考核。,B 理解目标层次表述,1、通过给出一个例题或样本,转换诸如一般原理之类的抽象理念的能力 2、阅读符号信息的能力 3、领会词语的弦外之音的能力 4、翻译外语的能力
22、5、读懂地图、图表、漫画的能力 6、据阅读材料、观察和听讲,写出概要的能力 7、据上、下文领会其中若干特殊词语意义的能力 8、识别双关语或意义含糊词语的能力 9、据表中的数据进行外推的能力 10、估计或预测某信息所描绘的行为进程结果的能力 11、预测趋势持续状况的技巧 12、对造成预测欠准之因素的敏锐感知能力,提醒: 通常多数考“理解”试题考的是连续文本的理解,忽略对非连续文本理解的考核。而非连续文本理解能力也是现代信息社会非常重要的能力。,C 应用能力行为类型,1、能判断哪些原理和通则适合予处理新疑难情境。 2、能重述问题,以判断哪些原理和通则对于解决问题是必要的。 3、能确定某个特定原理或
23、通则成立的限度。 4、能识别某个特殊通则的例外情况,并说明理由。 5、能运用已知原理解释新现象。 6、能运用适当的原理或通则对新情境中可能发生的情况作出预测。 7、能运用适当的原理或通则去确定或认可新情境中某项特殊的行动或决策过程。 8、能说明在既定疑难情境中运用某个或某几个原理或通则的理由。,提醒: “应用”大多数是对某一个或一组“原理或通则”迁移的“可能性、条件性”的分析判断,或是对迁移的”方法、前景”的设计或预测。 “应用”强调的是新对象、新情景的迁移,否则只是“理解”。,D 分析能力行为类型,1、能运用给定的分析准则,对文献中的单词、短语和表述进行分类(属要素分析)。 2、能根据文献中
24、已知线索,推断没有直接阐明的特性或特征(属要素分析)。 3、能根据文献材料中的准则关系,推断出其中必然蕴藏着的,必不可少的或必要的内在性质,假设或条件(属关系分析)。 4、能运用准则(如关联、因果、顺序)看出文献中材料的式样、次序或排列(属组织原理分析)。 5、能识别作为整个文献或活动的基础的原理或形式(属组织原理分析)。 6、能推断出文献赖以为基础的特殊结构、目的和观点(属又一类组织原理分析)。,提醒: 分析类似于解剖,或将研究对象分解为要素或部分作要素分析,或作要素间关系分析,或在要素分解基础上作组织原理分析。,E 评价能力行为类型,1、能按照一个文件或作品的准确性,精密度和谨慎程度,来对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 测量 理论 中考 命题
链接地址:https://www.31doc.com/p-2546730.html