《语言测试的种类.ppt》由会员分享,可在线阅读,更多相关《语言测试的种类.ppt(35页珍藏版)》请在三一文库上搜索。
1、语言测试的种类,第 三 讲,2,0. 语言测试种种,TOEFL IELTS CET TEM SAT HSK 测验、期中、期末考试(外语) 毕业考试(外语) 升学考试(外语) ,3,语言测试的分类标准,依据不同的分类标准,可以将语言测试分成不同的类别 测试的目的 测试的方式 测试语言技能的分合 测试的评分方式 测试时间的要求 测试对用户影响的大小 分数参照的标准 ,4,1. 测试涉及语言使用领域的不同,普通语言测试 测试一般场合的语言使用能力 专用语言测试 测试在某个(些)专门领域的语言使用能力,5,2. 测试目的不同,水平测试 成绩测试 分班测试 学能测试 诊断测试,6,2.1 水平测试 (p
2、roficiency test),可以测量普通的语言能力,也可以用来测量考生在某一领域或某些领域的语言能力 可以测量考生的某项或几项语言技能的水平 水平测试是一种基于某种语言能力理论(theory-based)的测试,不一定与某课程或教学内容直接关联 水平测试一般是大规模的标准化考试,多由专门的考试机构研发和实施 参加水平测试的考生总体成绩一般呈正态分布 水平测试多用于人才选拔,7,2.2 成绩测试 (achievement test),测量考生在某一课程或某个阶段的学习进展或学习成果,如单元测验、期中考试、期末考试。也叫“学业测试” 成绩测试本着“教什么学什么考什么”的原则,与一定的教学内容
3、密切相关,是基于一定教学内容或教学大纲(syllabus-based)的测试。期中考试、期末考试的命题范围应该以某个阶段所学的内容为限 成绩测试一般由教学人员或教学单位负责命题、组织、实施 对一个班的成绩测试所得的成绩不一定呈正态分布,8,2.3 学能测试 (aptitude test),测量考生学习语言的能力 学能测试是在考生学习一种新语言之前对其学习能力的测试,测试成绩跟学习者学习这种新语言的成功的可能性相关 高考 GRE(Graduate Record Examination) SAT(scholastic aptitude tests,scholastic achievement te
4、sts),9,2.4 分班测试 (placement test),分班测试(也叫“编班测试”)的设计与试题命制可以基于一定的语言能力理论,也可以基于一定的教学大纲 对考生的语言能力具有理想的区分作用 分班测试区分等级的多少取决于办学规模和新生数量的多少 一学期刚开学时的分班测试可以以前一学期各个等级所教学或学习的内容为命题范围,以检查新生是否达到某个阶段的合格水平,以便决定该考生是否能够进入更高一个等级学习 考生可以参加连续几个等级的测试,直到充分展示了他的语言能力,10,2.5 诊断测试 (diagnostic test),在教学过程中为了检验学生在某个阶段或在学习某些语言项目上的效果,即掌
5、握了哪些项目,更重要的是要检查考生在哪些项目上有欠缺,以便在教学上采取改进措施 课堂测验 单元测验 阶段测验 诊断测试的内容是基于一定的教学内容的(syllabus-based) 测试内容可多可少,可以是比较全面的测试,也可以是侧重于某些语言项目或语言点的,11,3. 测试方式不同,根据测试方式的不同,语言测试可分为 直接测试 间接测试,12,3.1 直接测试(direct test),要求考生直接运用某项语言技能 如: 考查考生的汉语发音情况,让考生朗读一段文字或自由发言 要了解考生的写作水平,让考生写文章 要了解考生的口语水平,让考生发言 直接测试的特点 测试形式具有真实性(authent
6、icity),测试内容与现实语境密切相关 直接测试的效度比较容易保证 直接测试的试题的答案通常是开放式的(open-ended) 直接测试面临的问题 如何制定评分标准 如何保证评分者信度 如何保证测试手段的有效性 试题数量很受限制,13,3.2 间接测试(indirect test),测试考生在与某种技能相关的语言项目上的反应来间接考查考生的某种语言能力。如: 让考生从一组释义项里选出某个词语的正确释义,考查正确理解词义的能力 让考生改正或选择某个语法形式,考查考生正确使用某种语法形式的能力 间接测试的特点 不追求测试形式与真实交际的直接联系(如,多项选择题、改错题、完形填空题等) 较少受语用
7、条件或语用环境的制约,便于采用较多的分立式试题以测试更广泛的语言项目(可用更多的试题) 试题的答案往往是唯一的。听力理解、阅读理解、语法结构等项目的测试多采用多项选择题 评分者信度比较容易得到保证 间接测试面临的问题 试题的目的不易确定,一道试题是测试哪种微技能往往会产生分歧 试题编制比较困难(语料的选择、题眼的确定、选项的编制、试题难易程度的把握等方面都十分困难) 效度不易保证,14,4. 测试语言技能的分合,根据测试语言技能分合的不同,语言测试可以分为: 分立式测试 综合式测试,15,4.1 分立式测试(discrete point test),分立式测试把语言分成语音、词汇、语法等要素,
8、再从这些要素中分出语言点,针对这些语言点设计试题,一道试题往往只测一个语言项目 分立式测试的特点 分立式测试试题所测的语言项目明确 较多采用多项选择题 分立式测试的信度比较容易保证 分立式测试面临的问题 分立式测试把语言分成许多分散的项目,很难考查考生在真实交际活动中的语言交际能力 分立式测试的测试效度难以得到保证,16,4.2 综合式测试 (integrative test),测试要求考生在答题时综合运用某些语言知识,而不是一道题目只测试一个语言点。通常运用的听写、完形填空、朗读、作文、口语等试题是综合式测试常用的题型 综合式测试的特点 在一定的上下文或语境中测试考生对语言项目的综合运用情况
9、 试题(主要是口语测试、作文测试等)比较接近真实的语言交际 综合式测试面临的问题 测试中要求考生提供开放性答案的试题(完形填空、作文、口语等),评分者信度较难保证 试题涉及哪些语言点或考生在答题时体现哪些微技能不易确定,17,5. 测试所用手段不同,根据测试所用手段的不同,语言测试可分为: 纸笔测试 口试 计算机辅助测试,18,5.1 纸笔测试 (paper-based test),传统的考试形式 纸笔测试的特点 测试时间可以可长可短 题量可多可少 测试内容可以比较广,适用的范围也较广 测试题型比较多(多项选择题、是非判断题、综合填空、改错、简答题、作文题等) 可以组织大量人员同时参加测试 纸
10、笔测试面临的问题 很难测试考生的口语能力 测试交际能力不够全面,较难保证真实性,19,5.2 口试(oral test),口语测试:录音、面谈 录音方式的特点 比较经济 比较容易组织(多人同时录音) 录音方式的问题 难以保证口语交际的真实性,缺乏互动(interaction) 测试时对录音设备要求较高(数量多,录音环境干扰) 面谈方式的特点 比较贴近真实的口语交际 面谈方式的问题 组织比较困难(大批考生候考,安排大批考生考同一试题容易泄密;安排不同试题,难以保证试题难度相当) 需要大批合格的主考人员,人员代价高。口语测试。一般分两种方式进行:用录音的方式或用面谈的方式,20,5.3 计算机(网
11、络)辅助测试 (computer-based test, internet-based test),试题在计算机上呈现给考生。从测试内容看,这种测试可以分为: 计算机辅助的传统测试 计算机辅助的自适应测试 基于计算机网络测试的特点 考生可以在不同的时间、不同的地点参加测试 自适应测试能够避免考生面对较多与自身水平不适应的试题 计算机辅助测试的问题 测试用设备、技术要求较高 对考生的额外要求增多,21,6. 评分方式不同,按照评分方式的不同,语言测试可以分为 客观性测试 主观性测试,22,6.1 客观性测试(objective test),试题答案具有规定性或排他性 提供备选项的试题(选择题,s
12、elective item) 答案具有唯一性的填空题等 客观性测试备有标准答案,评分工作比较简单,可用机器阅卷 客观性测试问题 这种测试很难测试考生产出性语言能力(即说、写和译的能力) 不易考查考生在真实交际环境中的语言交际能力,23,6.2 主观性测试 (subjective test),试题答案具有开放性或灵活性。考生根据试题构造答案(构答题,constructive item)。常用口语、写作、翻译等题型 阅读、听力测试中,有使用半主观性试题的。这种试题的答案是半开放的 常用来测试考生的产出性语言能力,可用来考查考生在真实交际环境中的实际交际能力 主观性测试的缺陷主要是难以掌握评分标准,
13、不易保证评分信度,24,7. 测试时间不同,按照测试对时间的不同要求,可以分为 速度测试 难度测试,25,7.1 速度测试(speed test),测试考生在规定的时间内答题的效率。对考生答题的时间进行比较严格的控制,考生答题的时间比较紧张 HSK(高等)阅读部分的构答题部分就是速度测试,这部分试题要求考生迅速从阅读材料中找出相关信息,这些信息在文中一般比较明显,考生应该具备快速检索关键信息的能力,26,7.2 难度测试(power test),测试考生掌握的具体知识或技能,试题的难度一般不会随所给答题时间的长短而改变 一些大规模测试既是难度测试,同时也要求一定的答题速度。如,HSK各等级考试
14、中的每个部分都规定了答题时间,在测试过程中,要求考生在规定的时间内完成规定部分的试题,27,8. 分数解释参照标准不同,解释测试分数的两种方式:标准参照和常模参照 语言测试分为 标准参照测试 常模参照测试 标准-常模参照测试,28,8.1 标准参照测试 (criterion-referenced test),根据对语言能力的理解,将语言能力分成若干个具体的项目,或将某种语言技能分成若干个等级,规定某个等级所包括的具体项目或技能 施行标准参照测试的基础是制定合适的标准(标准应该包括哪些项目,区分哪些等级,等级划分的依据是什么等) 标准的制定须要依据一定的语言能力理论并以科学的调查分析为基础,29
15、,8.2 常模参照测试 (norm-referenced test),考生参加测试得到的分数通过与常模群体中其他考生成绩进行比较才能加以解释 常模参照测试必须建立常模(构成常模样组的人,必须与测试所适用的对象完全同质。常模在测试所适用的对象中起尺度作用) 建立常模:通常是设计一个抽样方案,抽取一个有代表性的样本。常模样组越大(几千人、几万人)越有代表性越好 大规模考试实施时,应向考试对象公布:常模的建立过程、常模分数应该如何解释、常模的主要指标等,30,8.3 标准相关-常模参照测试 (criterion-related norm-referenced test),既具有标准参照测试的特点,又
16、具有常模参照测试的特点(如,HSK,CET) 既可用来考查考生掌握教学大纲规定的学习内容的情况,也可用来考查考生在全体考生中的相对位置 既与教学内容相关(依据一定的教学大纲,如HSK依据汉语水平词汇与汉字等级大纲,CET依据大学英语教学大纲),又与一定的语言能力理论为依据(如,HSK和CET都主张全面测试考生的听、说、读、写能力),31,9. 测试对用户影响的大小,测试用户包括采用测试的单位、参加测试的考生、采用测试结果的单位或个人等 测试对用户的影响有大小之分,据此测试可以分为 低风险测试 高风险测试,32,9.1 低风险测试 (low-stakes test),对测试用户在物质或精神上的影
17、响较小,测试的结果不会对考生的利益产生多大的影响(如,教学过程进行的测验) 测试结果可以作为改进教学、了解教学效果的参考,一般不作为用人或制定治疗方案决策的直接依据 测试研发单位承担的风险相对较小,33,9.2 高风险测试 (high-stakes test),对测试用户在物质或精神上的影响较大,测试的结果往往对考生的利益产生较大的影响(如,TOEFL,IELTS,CET) 大学录取、被怎样的大学录取 能否得到奖学金、得到多少奖学金 能否被用人单位录用 录取考生的素质 资源(师资、资金、设施等)的分配 录用人员是否能胜任某项工作 测试研发单位承担着更高的风险(包括用户的质疑、批评,社会舆论的压力等,34,10. 语言测试的分类与特征,依据不同的标准可以对语言测试进行不同的分类 就一项具体的测试而言,从不同的角度看,它往往具有多种测试的特征。如: HSK CET (HSK和CET特征对照),35,思考题: 1、语言测试根据其用途,可分为哪几类? 2、分立式测试与综合式测试各有什么优缺点? 3、谈谈成绩测试与水平测试的区别。 4、直接测试有什么缺陷? 5、主观性测试和客观性测试的主要区别是什么? 6、常模参照测试和标准参照测试有什么区别? 7、基于计算机的测试就是自适应测试吗?为什么? 8、为什么说CET是高风险测试?,
链接地址:https://www.31doc.com/p-2922985.html