【自編的測驗公平嗎?】
什麼就做測驗公平呢?如果熟悉IRT的話,在討論測驗公平性時,常會看到DIF這字眼,DIF是Differential Item Functioning的縮寫,其概念是指,有相同能力的兩個人作答試題,但是卻因為某一特徵(例如性別、居住地)的影響,而有不同的答對機率。
以92年第一次國中基測社會科為例,在社會科總分一樣的前提下,研究發現鄉下、都市學生在這題的答對率差異很大,代表這試題存在DIF,這現象發生的原因,可能就是不同地區的學生,對騎樓這訊息提取的難度不同導致的
通常,在自編測驗或量表後,除了確保測驗的信效度、鑑別度、難度分析外,有些研究者還會逐題判斷試題是否存在DIF。
DIF的檢測,簡單介紹以下四種檢測取向,各有各的優缺點,端看研究者擅長哪一取向而定。 (1)MH法:利用卡方來進行檢定。 (2)對數迴歸法:利用組別和能力之間的交互作用係數(截距、斜率)。 (3)IRT取向:定題法,DIF-free then DIF程序。 (4)SEM取向:利用MIMIC模式,或多群組CFA來檢定。
Comments