心理科学Psychological Science2008.31(1):177-180 177 ·研究方法· IRT模型参数估计的新方法一MCMC算法 涂冬波!漆书青·1蔡艳2戴海琦1丁树良3 (江西师范大学教育学院,南吕,330027)(2江西师范大学数学与信息科学学院,南昌,330027) (江西师范大学计算机信息工稻学院,南昌,330027) 摘要本研究主要探讨MCMC算法在IRT模型参数估计中的实现及其估计精度。通过模拟多种实验条件(人少题少、人题 适中,人多题多、被试数及其参数固定情况下项目数变化,项目数及其参数固定情况下人数变化),考察两参数和叁参数Lcgs 模型的MCMC算祛对其参数估计的精度,并与国际通用测量程序-Bilg程序(E-M算法)进行比较研究。模拟实验研究表 明,上述各种实验条件下,MCMC算法均可用于IRT模型参数估计,且其估计的精度均较BlOg程序(E-M算法)高,值得推广。 关键词:马尔可夫链朦特卡洛Logistic模型E一M算法 1引言 难于实现其参数估计,他们运用MCMC方法实现了该模型 项目反应理论(RT)自20世纪60年代以来,由于其理 的参数估计:Jimmy,Douglas(2004)91使用MCMC方法估计 论模型的科学性和精确性,一直受到心理和教育测量学的研 高维的认知诊断模型一Higher-order DINA model、和 究者和实际工作者的关注和兴趣,至今已成为考试技术学研 LLM,深入研究了MCMC算法在认知诊断模型中参数估计 究领城中最有影响的一种现代测量理论。其在实际应用 的运用;Jinag Yanlin(2005)1o1使用MCMC算法估计多维项 中存在的核心问题在于参数估计的复杂性,随着现代统计学 目反应模型(multidimensional item response theory model)的参 及数学的不断发展,参数估计的方法也不断发展,其估计方 数,拓展了传统单维IRT模型。因此,MCMC算法实现了 法主要有“联合极大似然估计”(JMLE)、“边标极大似然估 RT中以下几类模型的参数估计:第一,不再局限于“单维” 计“(MMLE)、“条件期望-极大化算法"(E-M算法)等2。 模型,已经实现了多维模型参数估计;第二,即使是单维模 1992年统计学家J.H.Albert(1992)3)首先将马尔可夫链蒙 型,但参数个数在三个以上:第三,不再局限于“局部独立”条 特卡洛(Markov Chain Monte Carlo.,MCMC)方法应用到IRT 件下,在估计试题相依模型参数。总之,在RT模型参数估 参数估计研究中,大大简化了RT中参数估计的复杂度,并 计中,MCMC方法实现了E-M算法难于或无法解决的问 且估计精度较好。MCMC方法源于物理学研究,20世纪末 题,更好地服务实际。但在我国MCMC算法在IRT参数估 引人心理计量学领域,它是一种动态的计算机模拟技术,是 计的研究却很少,目前仅看到王权老师(2006))介绍的关于 根据任一多元理论分布,特别是根据贝叶斯(Bays)推断为中 国外学者将MCMC方法应用于1RT参数估计。而本文主要 心的多元后验分布,米模拟随机样本的一种方法。其基本 是想研究MCMC算法在IRT下Logistic模型参数估计的可 思想是通过模拟服从某一分布也即平稳分布(一般是待估参 行性、参数估计的实现及参数估计的精度,探讨MCMC方法 数的联合后验分布)的马尔可夫链,然后根据模拟的马尔可 在RT参数估计中具体运用。国外虽然有过同类研究,但并 夫链上的样本点对待估参数进行估计。 没有设计系统的实验来比较MCMC算法与EM算法,且 当IRT模型中的参数的个数或维度过多时,传统的E一 MCMC算法参数估计的返真性也未见报道,本文主要是尝试 M算法一般难于或无法实现模型的参数估计。自MCMC算 弥补这方面空缺,以期推进我国心理测量学的发展。 法引进心理计量学领域后,心理计量领域中的许多复杂、高 维模型的参数估计成为现实,它是一种全新的参数估计方 2研究方法 法。在国外,目前该算法已被广泛应用于1RT下的各种模型 2.1IRT下Logistic模型MCMC算法参数估计过程 的参数估计。Patz&Junker(1999)[4.s]应用MCMC方法估 对于叁参数的Logistic模型(3PLM),其概率模型为P 计IRT下的Logistie模型、分部评分模型(partial credit 1-9 models)及GLLT模型(generalized linear logistic test model)的 (a,69)=s+1+c即(-Dg-万(D=I。Logistie横 参数估计,拓广了MCMC方法在IRT参数估计的实际应用: 型中,参数的先验分布一般为:0~N(0,1),Log(a)~N(0,1), Bradlow,Wainer,Wang(1999)i61运用MCMC方法估计两参 b-N(0,1),C-~B(5,17)。采取Gibbs抽样下的随机移动M 数Logistic的相依题组模型(testlet model),成功实现了题组 -H算法[1-13(jumping M-H),生成项目参数和被试参数 内项目间存在相依IRT模型的参数估计:Wainer,Bradlow, 的马尔可夫链,再以所生成链上的样本点的均值作为参数的 Du(2001)[7I运用MCMC方法来估计参参数Logistic的题组 估计值,就可具体实现参数估计。其过程如下: 模型,拓展了题组模型的使用范围,并研究了题组模型在 (1)设定被试参数及项目参数的初始状态:P=0,B=0, CAT中应用;Hart,Rouss,Stout(2002)[s]提出了认知诊断 ·A°=1。即所有被试能力参数初值均为0,所有项目参数初值 的新模型一fusion model,由于该模型比较复杂,E-M算法 均为(A=1,B=0)。 ·通讯作者:漆书青,男。E-mail:jxnugsq@126com 万方数据心理科学Psychological Science 2008,3l(1):177~180 t77 IRT模型参数估计的新方法——MCMC算法 涂冬波1漆书青+1蔡艳2戴海琦1 丁树良3 (1江西师范大学教育学院,南昌,330027)(2江西师范大学数学与信息科学学院,南昌,330027) (3江西师范大学计算机信息工程学院,南昌,330027) 。研究方法· 摘要本研究主要探讨MCMC算法在IRT模型参数估计中的实现及其估计精度。通过模拟多种实验条件(人少题少、人题 适中、人多题多、被试数及其参数固定情况下项目数变化、项目数及其参数固定情况下人数变化).考察两参数和叁参数Logistic 模型的MCMC算法对其参数估计的精度,并与国际通用测量程序一Bi】og程序(E—M算法)进行比较研究。模拟实验研究表 明,上述各种实验条件下,MCMC算法均可用于IRT模型参数估计,且其估计的精度均较Bilog程序(E—M算法)高,值得推广。 关键词:马尔可夫链蒙特卡洛Logistic模型 E—M算法 1 引言 项目反应理论(IRT)自20世纪60年代以来,由于其理 论模型的科学性和精确性,一直受到心理和教育测量学的研 究者和实际工作者的关注和兴趣,至今已成为考试技术学研 究领域中最有影响的一种现代测量理论…。其在实际应用 中存在的核心问题在于参数估计的复杂性,随着现代统计学 及数学的不断发展,参数估计的方法也不断发展,其估计方 法主要有“联合极大似然估计”(JMLE)、“边际极大似然估 计”(MMLE)、“条件期望一极大化算法”(E—M算法)等[2】。 1992年统计学家J.H.Albert(1992)¨]首先将马尔可夫链蒙 特卡洛(Markov Chain Monte Carlo,MCMC)方法应用到IRT 参数估计研究中,大大简化了IRT中参数估计的复杂度,并 且估计精度较好。MCMC方法源于物理学研究,20世纪末 引入心理计量学领域,它是一种动态的计算机模拟技术,是 根据任一多元理论分布,特别是根据贝叶斯(Bayes)推断为中 心的多元后验分布,来模拟随机样本的一种方法It J。其基本 思想是通过模拟服从某一分布也即平稳分布(一般是待估参 数的联合后验分布)的马尔可夫链,然后根据模拟的马尔可 夫链上的样本点对待估参数进行估计。 当IRT模型中的参数的个数或维度过多时,传统的E— M算法一般难于或无法实现模型的参数估计。自MCMC算 法引进心理计量学领域后,心理计量领域中的许多复杂、高 维模型的参数估计成为现实,它是~种全新的参数估计方 法。在国外,目前该算法已被广泛应用于IRT下的各种模型 的参数估计。Patz&Junker(1999)¨’5j应用MCMC方法估 计IRT下的Logistic模型、分部评分模型(partial credit models)及GLLT模型(generalized linear logistic test model)的 参数估计,拓广了MCMC方法在IRT参数估计的实际应用; Bradlow,Wainer,Wang(1999)【6 J运用MCMC方法估计两参 数Logistic的相依题组模型(testlet model),成功实现了题组 内项目间存在相依IRT模型的参数估计;Wainer,Bradlow, Du(2001)(7 J运用MCMC方法来估计叁参数Logistic的题组 模型,拓展了题组模型的使用范围,并研究了题组模型在 CAT中应用;Hartz,Rouss,Stout(2002)【8 J提出了认知诊断 的新模型——f嘁on model,由于该模型比较复杂,E—M算法 *通讯作者:漆书青,男。E:mail:jxduqsq@126eom 难于实现其参数估计,他们运用MCMC方法实现了该模型 的参数估计;Jimmy,Douglas(2004)【91使用MCMC方法估计 高维的认知诊断模型——Higher—order DINA model、和 LLM,深入研究了MCMC算法在认知诊断模型中参数估计 的运用;Jinag Yanlin(2005)11叫使用MCMC算法估计多维项 目反应模型(multidimensional item response theory model)的参 数,拓展了传统单维IRT模型。因此,MCMC算法实现了 IRT中以下几类模型的参数估计:第一,不再局限于“单维” 模型,已经实现了多维模型参数估计;第二,即使是单维模 型,但参数个数在三个以上;第三,不再局限于“局部独立”条 件下,在估计试题相依模型参数。总之,在IRT模型参数估 计中,MCMC方法实现了E—M算法难于或无法解决的问 题,更好地服务实际。但在我国MCMC算法在[RT参数估 计的研究却很少,目前仅看到王权老师(2006)[1 J介绍的关于 国外学者将MCMC方法应用于IRT参数估计。而本文主要 是想研究MCMC算法在IRT下Logistic模型参数估计的可 行性、参数估计的实现及参数估计的精度,探讨MCMC方法 在IRT参数估计中具体运用。国外虽然有过同类研究,但并 没有设计系统的实验来比较MCMC算法与EM算法,且 MCMC算法参数估计的返真性也未见报道,本文主要是尝试 弥补这方面空缺,以期推进我国心理测量学的发展。 2研究方法 2.1 IRT下Logistic模型MCMC算法参数估计过程 对于叁参数的Logistic模型(3PLM),其概率模型为Pii 1一, (。;,ai,bj,ci)2 Ci+Ⅳ面寺未F研(D=1)。Logism模 型中,参数的先验分布一般为:0~N(O,1),Log(a)~N(O,1), b-N(O,1),C~B(5,17)。采取Gibbs抽样下的随机移动M —H算法[“一t3](jumping M—H),生成项目参数和被试参数 的马尔可夫链,再以所生成链上的样本点的均值作为参数的 估计值,就可具体实现参数估计。其过程如下: (1)设定被试参数及项目参数的初始状态:00=0.B0=0, Ao=1。即所有被试能力参数初值均为0,所有项目参数初值 均为(A=1,B=0)。 万方数据