Rasch Model簡介.ppt.ppt
《Rasch Model簡介.ppt.ppt》由会员分享,可在线阅读,更多相关《Rasch Model簡介.ppt.ppt(36页珍藏版)》请在三一文库上搜索。
1、Rasch Model簡介,指導老師:韓復華 教授 學生:顏鴻祥,內容大綱,心理計量學 古典測驗理論 當代測驗理論 試題反應理論 Rasch Model,心理計量學,為研究心理測驗(psychological testing)與評斷(assessment)的科學(Cohen, Montague, Nathanson, & Swerdlik, 1988, P.26),研究範圍包括量化心理學(quantitative psychology)、個別差異(individual differences)、和心理測驗理論(mental test theories)等。 起源:比奈賽門(Binet-Simo
2、n) 測驗理論(test theory)(或全稱心理測驗理論)是一種解釋測驗資料間實證關係(empirical relationships)之有系統的理論學說,通常可分成二大學派: 古典測驗理論(classical test theory)主要以真實分數模式(true score model) 為骨幹; 當代測驗理論(modern test theory) 主要是以試題反應理論(item response theory) 為架構。,古典測驗理論(1/3) (Classical Test Theory, CTT),比奈賽門的第一個心理測驗問世後,正是心理計量學誕生之始,後經諸多學者(如:Cron
3、bach, 1951; Guilford, 1954; Gullikson, 1987; Guttman, 1944; Lord Tucker, 1946)的研究與闡述,歸納形成古典測驗理論等學說。 古典測驗理論採用真實分數模式,主要目的在估計測驗分數之準確值,解決測驗信度問題,以下為其數學式 X = T + E (觀察值) (真實分數) (誤差) 觀察值為研究者實際觀察到的數值。 真實分數為研究者欲測量特質,古典測驗理論(2/3) (Classical Test Theory, CTT),古典測驗理論之五項基本假設為Allen & Yen(1979) 若兩測驗滿足前5假設,其觀察分數為X1=
4、T1+E1、X2=T2+E2,若T1=T2、VAR(E1)=VAR(E2),則此二測驗稱為複本測驗(Parallel Tests) 若兩測驗滿足前5假設,其觀察分數為X1、X2,且對每群考生若兩測驗都僅差一常數,則稱此二測驗為本質相等之測驗(Essentially -equivalent tests),古典測驗理論(3/3) (Classical Test Theory, CTT),古典測驗理論優點為: 基本概念與數學公式簡單易懂 理論發展歷史悠久,頗具規模 無須特殊電腦軟體來估計古典測驗理論之參數 無強制假設(weak assumptions),因此多數資料均可符合古典測驗理論之假設,應用廣
5、泛,古典測驗理論的先天缺失,古典測驗理論缺點為: 採用指標皆屬樣本依賴(sample dependent)的指標,諸如:難度(difficulty)、鑑別度(discrimination)、和信度(reliability)等。 很難保證受測者接受兩次相同或相似測驗時,能保持測驗為獨立、無關,且複本(Parallel Tests)編制困難 無法預測受測者能力 未考量受測者能力差異,用同一個標準誤解釋所有人特質或能力,亦產生偏頗結論,也是CTT最受質疑的地方 非複本但具相同功能的測驗間無法提供有意義比較 忽視作答者的作答反應組型,僅採用總分來解釋受測者能力,如此將喪失許多訊息,並使推論與解釋發生偏
6、誤,當代測驗理論 (Modern Test Theory, MTT),一般說來,為了克服古典測驗理論的缺失,才有當代測驗理論的誕生。 當代測驗理論的內涵,主要是以試題反應理論為理論架構,依據強勢假設(strong assumptions)而來,其理論的發展為時稍晚,理論模式也不斷的在發展當中,所採用的計算公式複雜深奧、艱澀難懂,為一立論與假設均合理與嚴謹的學說,所適用的測驗資料種類雖屬有限,但深受測驗學者的青睞,已有逐漸凌駕古典測驗理論之上,甚至進而取而代之之勢。,採用的試題參數(item parameters)(如:難度、鑑別度、猜測度等)為不受樣本影響(sample-free)的指標。 針
7、對每位受試者,提供個別差異的測量誤差指標,而非單一相同的測量標準誤,因此能夠精確推估受試者的能力估計值。 可經由適用的同質性試題組成的分測驗,測量估計出受試者個人的能力,而不受測驗的影響(test-free),並且對於不同受試者間的分數,亦可進行有意義的比較。 以試題訊息量(item information)及試卷訊息量(test information)的概念,來作為評定某個試題或整份試卷的測量準確性,取代古典測驗理論的信度,作為評定試卷內部一致性指標。 同時考慮受試者的反應組型與試題參數等特性,因此在估計個人能力時,除了能夠提供一個較精確的估計值外,對於原始得分相同的受試者,也往往給予不同
8、的能力估計值。 採用的適合度考驗值(statistic of goodness-of-fit),可提供考驗模式與資料間之適合度、受試者的反應是否為非尋常(unusual)等參考指標。 (Hambleton, 1989; Hambleton Lord, 1980),當代測驗理論之特點,當代測驗理論係建立在理論假設嚴謹的數理統計學機率模式上,是一種複雜深奧、艱澀難懂的測驗理論,這對於在數學方面訓練有限的教育與心理學界學者而言,無非是一大挑戰。 多數當代測驗理論學者都是出身自數學界或曾是數學主修者 過去電腦科技的進步有限,沒有電腦套裝軟體程式的即時配合,當代測驗理論中對模式參數的估計,難以用手算或小
9、型計算機順利進行,因此在應用上更受限制。 有些古典測驗理論的擁護者,對當代測驗理論的研究與發展,所能獲致之成效與應用性深表懷疑。為了證明與解釋疑惑,當代測驗理論學派的支持者,便更朝理論模式的量化技術方面探討,致使當代測驗理論的發展愈趨數學化、數量化、與電腦化。 礙於嚴苛的基本假設,當代測驗理論所能適用的教育與心理測驗資料有限,並且需要大樣本的配合,因此使得它的應用性大打折扣,未獲一般測驗使用者的全力擁護。,當代測驗理論之缺點,兩派測驗理論之比較,測驗理論的發展趨勢(1/2),從Lord(1980)發表第一本以試題反應理論為名的專書後,當代測驗理論正式以試題反應理論為其中心架構。 試題反應理論雖
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Rasch Model簡介.ppt Model 簡介 ppt
链接地址:https://www.31doc.com/p-5121131.html