Rasch Model簡介.ppt.ppt

上传人：椰子壳

文档编号：5121131

上传时间：2020-02-04

格式：PPT

页数：36

大小：551.50KB

《Rasch Model簡介.ppt.ppt》由会员分享，可在线阅读，更多相关《Rasch Model簡介.ppt.ppt（36页珍藏版）》请在三一文库上搜索。

1、Rasch Model簡介,指導老師：韓復華教授學生：顏鴻祥,內容大綱,心理計量學古典測驗理論當代測驗理論試題反應理論 Rasch Model,心理計量學,為研究心理測驗(psychological testing)與評斷(assessment)的科學(Cohen, Montague, Nathanson, & Swerdlik, 1988, P.26)，研究範圍包括量化心理學(quantitative psychology)、個別差異(individual differences)、和心理測驗理論(mental test theories)等。起源：比奈賽門(Binet-Simo

2、n) 測驗理論(test theory)（或全稱心理測驗理論）是一種解釋測驗資料間實證關係(empirical relationships)之有系統的理論學說，通常可分成二大學派：古典測驗理論(classical test theory)主要以真實分數模式(true score model) 為骨幹；當代測驗理論(modern test theory) 主要是以試題反應理論(item response theory) 為架構。,古典測驗理論(1/3) (Classical Test Theory, CTT),比奈賽門的第一個心理測驗問世後，正是心理計量學誕生之始，後經諸多學者（如：Cron

3、bach, 1951; Guilford, 1954; Gullikson, 1987; Guttman, 1944; Lord Tucker, 1946）的研究與闡述，歸納形成古典測驗理論等學說。古典測驗理論採用真實分數模式，主要目的在估計測驗分數之準確值，解決測驗信度問題，以下為其數學式 X = T + E (觀察值) (真實分數) (誤差) 觀察值為研究者實際觀察到的數值。真實分數為研究者欲測量特質,古典測驗理論(2/3) (Classical Test Theory, CTT),古典測驗理論之五項基本假設為Allen & Yen(1979) 若兩測驗滿足前5假設，其觀察分數為X1=

4、T1+E1、X2=T2+E2，若T1=T2、VAR(E1)=VAR(E2)，則此二測驗稱為複本測驗(Parallel Tests) 若兩測驗滿足前5假設，其觀察分數為X1、X2，且對每群考生若兩測驗都僅差一常數，則稱此二測驗為本質相等之測驗(Essentially -equivalent tests),古典測驗理論(3/3) (Classical Test Theory, CTT),古典測驗理論優點為：基本概念與數學公式簡單易懂理論發展歷史悠久，頗具規模無須特殊電腦軟體來估計古典測驗理論之參數無強制假設(weak assumptions)，因此多數資料均可符合古典測驗理論之假設，應用廣

5、泛,古典測驗理論的先天缺失,古典測驗理論缺點為：採用指標皆屬樣本依賴(sample dependent)的指標，諸如：難度(difficulty)、鑑別度(discrimination)、和信度(reliability)等。很難保證受測者接受兩次相同或相似測驗時，能保持測驗為獨立、無關，且複本(Parallel Tests)編制困難無法預測受測者能力未考量受測者能力差異，用同一個標準誤解釋所有人特質或能力，亦產生偏頗結論，也是CTT最受質疑的地方非複本但具相同功能的測驗間無法提供有意義比較忽視作答者的作答反應組型，僅採用總分來解釋受測者能力，如此將喪失許多訊息，並使推論與解釋發生偏

6、誤,當代測驗理論 (Modern Test Theory, MTT),一般說來，為了克服古典測驗理論的缺失，才有當代測驗理論的誕生。當代測驗理論的內涵，主要是以試題反應理論為理論架構，依據強勢假設(strong assumptions)而來，其理論的發展為時稍晚，理論模式也不斷的在發展當中，所採用的計算公式複雜深奧、艱澀難懂，為一立論與假設均合理與嚴謹的學說，所適用的測驗資料種類雖屬有限，但深受測驗學者的青睞，已有逐漸凌駕古典測驗理論之上，甚至進而取而代之之勢。,採用的試題參數(item parameters)（如：難度、鑑別度、猜測度等）為不受樣本影響(sample-free)的指標。針

7、對每位受試者，提供個別差異的測量誤差指標，而非單一相同的測量標準誤，因此能夠精確推估受試者的能力估計值。可經由適用的同質性試題組成的分測驗，測量估計出受試者個人的能力，而不受測驗的影響(test-free)，並且對於不同受試者間的分數，亦可進行有意義的比較。以試題訊息量(item information)及試卷訊息量(test information)的概念，來作為評定某個試題或整份試卷的測量準確性，取代古典測驗理論的信度，作為評定試卷內部一致性指標。同時考慮受試者的反應組型與試題參數等特性，因此在估計個人能力時，除了能夠提供一個較精確的估計值外，對於原始得分相同的受試者，也往往給予不同

8、的能力估計值。採用的適合度考驗值(statistic of goodness-of-fit)，可提供考驗模式與資料間之適合度、受試者的反應是否為非尋常(unusual)等參考指標。 (Hambleton, 1989; Hambleton Lord, 1980),當代測驗理論之特點,當代測驗理論係建立在理論假設嚴謹的數理統計學機率模式上，是一種複雜深奧、艱澀難懂的測驗理論，這對於在數學方面訓練有限的教育與心理學界學者而言，無非是一大挑戰。多數當代測驗理論學者都是出身自數學界或曾是數學主修者過去電腦科技的進步有限，沒有電腦套裝軟體程式的即時配合，當代測驗理論中對模式參數的估計，難以用手算或小

9、型計算機順利進行，因此在應用上更受限制。有些古典測驗理論的擁護者，對當代測驗理論的研究與發展，所能獲致之成效與應用性深表懷疑。為了證明與解釋疑惑，當代測驗理論學派的支持者，便更朝理論模式的量化技術方面探討，致使當代測驗理論的發展愈趨數學化、數量化、與電腦化。礙於嚴苛的基本假設，當代測驗理論所能適用的教育與心理測驗資料有限，並且需要大樣本的配合，因此使得它的應用性大打折扣，未獲一般測驗使用者的全力擁護。,當代測驗理論之缺點,兩派測驗理論之比較,測驗理論的發展趨勢(1/2),從Lord(1980)發表第一本以試題反應理論為名的專書後，當代測驗理論正式以試題反應理論為其中心架構。試題反應理論雖

10、然自1980年才正式正名成立，然而在30和40年代，試題反應理論便已有初步的理論架構。其中，Tucker(1946)便是第一位使用試題特徵曲線（item characteristic curve，簡稱ICC）一詞的心理計量學家，這一名詞也逐漸成為試題反應理論的中心概念。,測驗理論的發展趨勢(2/2),隨著近年來人類在電腦科技上的突飛猛進，各種適用於試題反應理論的電腦軟體程式（如：目前最常用，也最有名的程式BILOG和LOGIST等）相繼誕生與再版修訂，已使得美國很多研究機構、地方政府機關、和私人團體，都率先採用試題反應理論作為他們編製測驗、施測、計分、解釋、與提供諮詢服務的依據。未來趨勢：

11、數學化電腦化專家化,試題反應理論(item response theory)之基本概念,受測者(examinee)在某一測驗試題上的表現情形，可由一組因素來加以預測或解釋，這組因素叫作潛在特質(latent traits)或能力(abilities) 考生的表現情形與這組潛在特質間的關係，可透過一條連續性遞增的函數來加以詮釋，這個函數便叫作試題特徵曲線（item characteristic curve，簡寫為ICC）。,試題特徵曲線,七個不同的試題特徵曲線例子（資料來源：Hambleton & Cook, 1977）,試題特徵曲線與兩族群受測者的能力分配曲線,Rasch模式,試題反應理論

12、中最簡單模式-單參數羅吉斯特模式。由George Rasch於1960年提出，利用對數勝算比的觀念建立具類等距與可加性之logit量尺，在此量尺之基礎下，利用受測者在試題上之答題情況測量出試題之困難度，再利用受測者在困難度不同之試題上之表現情況，測量出受測者之能力。 Rasch模式可用於二元資料或多元資料之分析。,基本假設,單向度(unidimensionality)：試題反應理論中的各種模式有個最常用的共同假設，那就是測驗中的各個試題都測量到同一種共同的能力或潛在特質。局部獨立性(local independence)：當影響測驗表現的能力被固定不變時，考生在任何一對試題上的反應，在統計

13、學上而言是獨立的；換句話說，在考慮考生的能力因素後，考生在不同試題上的反應間沒有任何關係存在。這意謂著涵蓋在試題反應模式裡的能力因素，才是唯一影響考生在測驗試題上做反應的因素；這組能力因素代表整個潛在空間(complete latent space)，當單向度基本假設成立時，這整個潛在空間僅包含一種能力因素。非速度測驗知道正確假設(know-correct assumption)：如果考生知道某一試題的正確答案，他她必然會答對該試題；此外，省略不答的試題(omitted items)和未答完的試題(unreached items)有所不同，前者是受能力影響所致，後者是受施測速度影響所致。本

14、假設僅能適用於前者，它和前個假設一樣，都隱含在單向度假設裡，故殊少被提及。,Rasch模式-以二元資料為例：,答對答錯勝算比(odds ratio),取自然對數(ln),類等距與可加性特性,典型的單參數試題特徵曲線,Rasch模型評分之優點,單一維度性局部獨立性可再製性可驗證性,李克特五尺度之應用改良式Rasch模型,在兩個相鄰等級評分之間建立一道試題之等級難度門檻(threshold) ，將原屬於多項等級尺度資料之問題拆解成多個二項等級尺度資料之問題按其試題難度門檻設定方式又可分為：評分尺度Rasch模式 (rating scale Rasch model) 部分給分Rasch模式

15、 (partial credit Rasch model),評分尺度模型部分給分模型,李克特五尺度衡量概念,參數校估,最大概似估計法邊際最大概似估計法聯合最大概似估計法容易運算易於延伸較具效率需符合Guttman Scale(累積量表)之特性,資料之信度分析,Rasch模式信度分析信度通常是指測驗者填答每個試題的一致性，對於每個試題的選項感受程度不因試題的不同而改變。 Rasch模式有試題信度及受測者信度。 Example:,資料之效度分析(1/2),Rasch模式效度分析 Mean Square Fit Statistics 2dist. Outfit Statistics(

16、outlier-sensitive fit mean square),資料之效度分析(2/2),Rasch模式效度分析 Mean Square Fit Statistics 2dist. Infit Statistics(information-weighted fit mean square),目前推行共乘的單位,台南縣環保局國立高雄第一科技大學國立清華大學工業技術研究院民間：Carpool共乘網等,各大共乘網,Carpool共乘網http:/.tw/index.php 中華電信Enjoy24找共乘http:/ 高雄縣環保局第二課環保共乘網站http:/.tw/co-ride/ind

17、ex.asp 台南縣共乘制推廣網站http:/tainancarpool.org/ 奇集集交通共乘http:/.tw/f-Personals-rideshare-W0QQCatIdZ500732 綠色共乘系統（未完成）,配對需求基本設定(綜合各網站),路線、時間、頻率共乘偏好是否抽菸是否有駕照性別、職業等車主偏好是否允許車上飲食是否允許攜帶寵物,你覺得共乘最大的好處是什麼？,減少通勤成本：與人分攤油錢、高速公路過路費 56 % (2068) 減少塞車問題 8 % (293) 減少空氣污染 12 % (469) 減少停車問題 5 % (209) 降低購車需求 4 % (161) 認

18、識新朋友 12 % (455) 資料來源：Carpool共乘網2008.07.30,對共乘擔心的問題,共乘安全性 55 % (1186) 找不到共乘路線 27 % (599) 共乘費用不合理 16 % (357) 其他0 % (13) 資料來源：Carpool共乘網2008.07.30,Reference,余民，試題反應的介紹-測驗的發展趨勢（一），研習資訊，8 卷6 期，13-17頁，民國八十。余民，IRT 學與應用網頁，.tw/e-irt/irt.htm 張育豪，日常運之交通工具使用依賴研究-以台會區民眾為，國交通大學運輸科技與管學系，碩士文，民國95 。楊舜棠，應用駕駛行為量表探討駕駛教育對道路駕駛行為影響之研究，國交通大學運輸科技與管學系，碩士文，民國96。張新立、朱來順，鐵路司機員適應影響行車安全壓力源之能力量測，運輸計劃季刊，第三十七卷，第二期，民國九十七年六月，頁 139 頁164 。吳舜丞，者潛在構面之測：輛使用依賴性之探與人搭乘公能感認之衡，國交通大學運輸科技與管學系，博士文，民國97。,

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

6 元

下载	加入VIP免费专享

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: Rasch Model簡介.ppt Model 簡介 ppt

三一文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：Rasch Model簡介.ppt.ppt
链接地址：https://www.31doc.com/p-5121131.html