研究生: |
葉育光 |
---|---|
論文名稱: |
不完全資料多元計分多參數試題選項分析模式 |
指導教授: |
黃提源
劉湘川 |
口試委員: | |
學位類別: |
碩士 Master |
系所名稱: |
理學院 - 統計學研究所 Institute of Statistics |
論文出版年: | 2003 |
畢業學年度: | 91 |
語文別: | 中文 |
論文頁數: | 52 |
中文關鍵詞: | 多元計分 、不完全資料 、試題選項分析 、多參數試題選項分析模式 、半最大概似法 、最大概似法 |
相關次數: | 點閱:2 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
隨著時代的進步及電腦運算速度的加快,大型考試日益增加而受試者要求評分的公平性有增無減,所以採用客觀性、計分容易及可快速電腦化處理的考試已是時勢所趨,因此大多採用選擇題型的試卷。而選擇題型之作答,為多元類別反應資料,其考慮了同一試題中各誘答選項之誘答力不盡相同的情況,較二元計分三參數模式靈敏且完善。
雖然多元計分較二元計分來的靈敏及完善,但是在處理能力參數及試題參數估算時,前者較後者來的繁雜且當遇到受試者未答試題選項時,無法直接有效及快速的估算能力參數及試題參數,為了解決這二個問題,劉湘川及劉新梧發表「能力參數相關加權常態轉換估計法」及「不完全資料之多元計分三參數試題選項分析擴充模式」,引進未答虛擬選項及未答力參數的構想,再以兩段式估算能力參數及試題參數的概念,先利用「能力參數相關加權常態轉換估計法」估得能力參數後,再利用最大概似法估得題目參數,簡稱半最大概似法。
雖然半最大概似法較最大概似法來的快速及簡便,但至今無人比較此兩種估算方法,何者較準確?本研究修改上述所提模式中的未答虛擬選項機率函數,針對修改後的模式,比較半最大概似法及最大概似法的優缺點。
中文文獻:
王文中(民85):幾個有關Rasch測量模式的爭議。教育與心理研究。第19輯。1-26頁。台北市:國立政治大學。
王寶墉(民82):現代測驗理論。台北市:心理出版社。
余民寧(民81):試題反應理論介紹(二)。(On-line)。http://edutest.nccu.edu.tw/edutest/page_10.htm
吳慧珉(民90):選項特徵曲線之研究-以核函數之平滑化為估計取向。台中市:國立台中師範學院教育測驗統計研究所碩士論文。
郭生玉(民79):心理與教育測驗。台北市:精華書局。
許擇基、劉長萱(民81):試題作答理論簡介。台北市:中國行為科學社。
劉湘川(民83):多變量牛頓參數迭代估計法之理論與應用。測驗統計簡訊。第八期。1-10頁。台中市:國立台中師範學院。
劉湘川、許天維、鄭富森(民87):IRT軟體估計精準度之比較。測驗統計年刊。第六輯。1-112頁。台中市:國立台中師範學院。
劉湘川(民89):點二系列相關試題鑑別指數之值譜分析及其在IRT上之應用。測驗統計年刊。第八輯。1-20頁。台中市:國立台中師範學院。
劉湘川(民89):多元計分三參數試題選項分析固定效應模式。測驗統計年刊。第八輯。21-36頁。台中市:國立台中師範學院。
劉湘川(民90):核平滑化試題選項特徵曲線與選項關聯結構整合擴充模式。測驗統計年刊。第九輯。1-18頁。台中市:國立台中師範學院。
劉湘川、劉新梧(民90):不完全資料之多元計分三參數試題選項分析擴充模式。測驗統計年刊。第九輯。19-45頁。台中市:國立台中師範學院。
英文文獻:
Baker, F. B. (1990). Some observations on the metric of PC-BILOG results. Applied psychological measurement, 14, 139-150.
Baker, F. B. (1992). Item Response Theory: parameter estimation techniques. New York: Marcel Dekker, Inc.
Drasgow, F. (1989). An evaluation of marginal maximum likelihood estimation for the two-parameter logistic model. Applied psychological measurement, 13, 77-90.
Lord, F. M. (1980) Applications of item response theory to practical testing problems. Hillsdale, N. J. Lawrence Erlbaum.
Mislevy, R. J. and Stocking , M. L. (1989). A consumer’s guide to LOGIST and BILOG. Applied psychological measurement, 13, 57-75.
Ramsay, J. O. (1991) Kernel smoothing approaches to nonparametric item
characteristic curve estimation. Psychometrika, 56, 611-630.
Skaggs, G. and Stevenson, J. (1989). A comparison of pseudo-Bayesian and joint maximum likelihood procedures for estimating item parameters in the three-parameter IRT model. Applied psychological measurement. 13, ,391-402.
Stone, C. A. (1992). Recovery of marginal maximum likelihood estimates in the two-parameter logistic response model: An evaluation of MULTILOG. Applied psychological measurement, 16,1-16.