178 心理科学 (2)假定项目参数已知,估计被试参数 ②计算从状态-1至转移概率a(0l,的)=nmin ①对各被试(i=1,2,…,N)独立地从所选取的建议分布 x(0) (proposal distribution)中随机抽取一状态0。理论上建议分 {0-马1(由于建议分布为对称的正态分布,故分子分母 布可取任何形式,但为计算简便,一般取对称分布(如正态分 的建议分布约掉,其中π(·)为参数的联合后验分布,它由所 布、均匀分布等),也即q(6-1,几)=q(0,0-1)。我们取被试 有参数的先验分布及被试作答的似然函数所决定,也即所构 参数的建议分布为正态分布,它以上一次选代的值为均数, 造马尔可夫链的极限分布或平稳分布(stationary 以一常数为方差,也即从9~N(-',C)中随机抽取被试参 distribution)。用此以决定状态是否进行转移。(下类同) 数的下一状态。(下类同) π() P(,A-,hQ(,A-1旷-)1 (-巧) X 除A-,时0除,A武e0-2- 1 ③生成随机数r~u[0,1],进行状态转移判断。 A-N(A-,C),IB-N(B-,C),C-N(C-1,C) 的,r≤a(-',) =传1>a(g-) ②计算从状态(A-',-',C-1)至(A,,C)转移的 概率a(A-l,B-I,C-1,A,,C)=min (3)假定被试参数已知,估计项目参数 (A,B,C) ①对各项目参数(G=1,2,…,m)独立生戒各自的下一状 A-,,C-可1。 用此以决定状态是否进行转移。 π(A,B,C) iP(,A,B)Q(,A,)- (A-1,C巧 IP(,A-1,B-1)Q(,A-1,B-1)1- ( (C)-1(1-C)b-t cp2o-1 1 1 (C-1)-1(1-C-)立 7 m-家e-P ③生存得分矩阵随机数r~U[0,1],进行状态转移判断。 {(A,B,C),r≤a(A-l,B-1,C-1),(A,B,C)) (A,B,C)= (A-l,-1,Ct),r>a(A-1,1,C-1),(A,B,C)) (4)重复(2)、(3)步骤L次(L为链长,本文取L=5000, 算法作一比较。Monet Carlo模拟过程:(1)指定项目参数和 但对于其它较为复杂的模型如多维【RT等,链长最好在 被试参数的分布(0一B(0,1),log(A)~N(0,1),C一B(5, 10000以上),取最后W次(本文取W=3000)次迭代的平均 17)),并从相应的分布中生成参数真值。(2)根据参数真值, 值作为初步参数估计值。 采用模拟方法生存被试得分矩阵。(3)根据所生成的被试得 (5)上述4步生存了一条链长为L的马尔可夫链,可再 分矩阵,采用E-M算法(Bilog3.0程序[9),收敛精度定为 重复上述4步五次(但第1步的初值最好有所变化,以保证5 0.001)和MCMC算法分别估计被试参数与项目参数。(4) 条链的相对独立),即生成五条马氏链,再取这五条链估出的最后将由两种算法的参数估出值与事先指定的参数真值进 参数值的均值为最终参数估计值。 行比较,若估计值与真值之间的差异越小说明该估计方法越 (6)收敛判断标准,以五条链所估出的参数的标准差(参 有效,反之越无效。反映差异的指标如下:平均绝对离差 数估计误差)为判断标准(若五条链所估出的参数一样,则其 (ABSE),ABSE=多IX-实N,x为参数真值,x为参数的估 标准差为0),本研究五条链所估参数的标准差均小于0.01, 计值,它反映了估计值与真值之间的绝对偏离程度,越小说 基本收敛。 明估计越准,也即该指标平均绝对离差(ABSE),能考察参数 理论上C,、CA、CB、dA,m的取值不待意固定,但根据 估计的返真性或精确性。 Patz和Junker的研究[4,s)表明,对于Logistic模型取C= 实验考察的因素有四个:题数、人数、模型(2PLM一 1.1,=1CA=0.3,C8=0.3,0=1/2,c=2对于所生存的马 3PLM)、估计方法(E-M、MCMC),具体设计如下: 尔可夫链相对比较合理。本研究采用Patz和Junker的研究 实验一:2PLM,人数变化,题目固定。两参数Logistic模 结果。对于区分度参数及猜测度参数的建议分布的选取,本 型下,固定项目数及其参数,考察人数的增加对项目参数估 文均采用具有对称性且抽样相对简单的正态分布,与Patz和 计精度的影响。题数固定为60题,人数分别为100、200、 Junker8的所采用的非对称的对数正态分布和B分布不同, 500、1000、2000、3000、4000人,且共用同批项目参数。 但在算法上却大大简化了Patz和Junker的算法。 实验二:2PLM,被试固定,题数变化。两参数Iogi5tic模 2.2实验设计 型下,固定被试数及其参数,考察题数的增加对被试参数估 为检验MCMC算法的可行性及估计的精确性,本研究 计精度的影响。人数固定为1000人,题数分别为10、30、50、 采用Monet Carlo模拟方法,考察其估计的精确性并与E-M,100、150、200题,且共用同批被试参数。 万方数据178 心理科学 (2)假定项目参数已知.估计被试参数 ①对各被试(i_L.2,…,N)独立地从所选取的建议分布 (proposal distribution)中随机抽取一状态0j。理论上建议分 布可取任何形式.但为计算简便,一般取对称分布(如正态分 布、均匀分布等),也即q(0k一1’uk0)=q(0k,ok—1)。我们取被试 参数的建议分布为正态分布,它以上一次迭代的值为均数, 以一常数为方差,也即从q。~N(oi-。,暖)中随机抽取被试参 数的下一状态0i。(下类同) ②计算从状态ei叫至01转移概率“(0j~.0j)=rain f,,水、 {黼,1}(由于建议分布为对称的正态分布,故分子分母 I●~、v , 的建议分布约掉,其中丌(·)为参数的联合后验分布,它由所 有参数的先验分布及被试作答的似然函数所决定,也即所构 造马尔可夫链的极限分布或平稳分布(stationary distribution))。用此以决定状态是否进行转移。(下类同) 。(ok) 尊P(。!,衅~,Bk一·)xtQ(oj,对一,B;【~-)-一n、,ex。{一去(。k)2} 丌(0k-1)直P(。i~,衅-t,B;叫)~Q(。k~,衅-1,B;。1)卜1。exp{一寿(。?叫)2} ③生成随机数r~u[o,1],进行状态转移判断。 q~N(对~,c叠),啦j~N(B}~,岛),qc~N(时.。,暖) {酵,r≤a(Oik一,oj) 1 }。k~,r>a(旷1,。k) (3)假定被试参数已知,估计项目参数 ①对各项目参数(j_I,2,…,m)独立生成各自的下一状 态 ②计算从状态(肆~,衅~,ck’1)至(衅,B},畸)转移的 概率a(对一,衅~,畔~,衅,衅,C孛) =min {i裔圣艴,t}。用此以决定状态是否进行转移。 丌(衅,Bj,ck) :r—w,(q,对,衅)1uQ(衅,衅,B{【)卜xii 丌(衅_。,Bk-。,Ck_1)r『NP(。k,衅~,B;一-)x日Q(o?,衅_。,Bj一-)-一x# exp{一壶‘B})2} 寿eXp{一赤‘Log(衅”2} ,(畔)。一·(1一ck)“一t —eXp{_土2aB2(B}_1)2}一嘉exp卜去(Log(衅.1))2}‘‘C}【。1户。1n—C{【‘1户‘1 ③生存得分矩阵随机数r~u[o,1],进行状态转移判断。 ,小仁。rk、一I(衅,衅,ck),r≤a(对~,衅~,C}【-1),(对,Bk,ck)) “”uj“∥ i(衅~,Bk~,Ck—t),r>。(衅_。,磷、_-,C}【叫),(衅,B?,C{【)) (4)重复(2)、(3)步骤L次(L为链长,本文取L=5000, 算法作一比较。Monet Carlo模拟过程:(1)指定项目参数和 但对于其它较为复杂的模型如多维IRT等,链长最好在 被试参数的分布(0~B(0,1),log(A)~N(0,1),C~B(5, 10000以上),取最后w次(本文取W=3000)次迭代的平均 17)),并从相应的分布中生成参数真值。(2)根据参数真值, 值作为初步参数估计值。 采用模拟方法生存被试得分矩阵。(3)根据所生成的被试得 (5)上述4步生存了一条链长为L的马尔可夫链,可再 分矩阵,采用E—M算法(Bil093.0程序旧1,收敛精度定为 重复上述4步五次(但第1步的初值最好有所变化,以保证5 0.001)和MCMC算法分别估计被试参数与项目参数。(4) 条链的相对独立),即生成五条马氏链,再取这五条链估出的 最后将由两种算法的参数估出值与事先指定的参数真值进 参数值的均值为最终参数估计值。 行比较,若估计值与真值之间的差异越小说明该估计方法越 (6)收敛判断标准,以五条链所估出的参数的标准差(参 有效,反之越无效。反映差异的指标如下:平均绝对离差 数估计误差)为判断标准(若五条链所估出的参数一样,则其(ABSE),ABSE=奎J玛一文ll/i'4,玛为参数真值,Ri为参数的估 标准差为o),本研究五条链所估参数的标准差均小于o·01, 计值,它反映了宿辞值与真值之间的绝对偏离程度,越小说 垄平仪双。 明估计越准,也即该指标平均绝对离差(ABSE),能考察参数 理论上Co、吣CA、CB、O"A、oBNIRNaV特NNg,但根据 估计的返真性或精确性。 Patz和Junker的研究H’51表明,对于Logistic模型取C。2 实验考察的因素有四个:题数、人数、模型(2PLM一 1.1、0"0=1、CA=0.3、CB=0.3、叭=1/2,d=2对于所生存的马 3PLM)、估计方法(E—M、MCMC),具体设计如下: 尔可夫链相对比较合理。本研究采用Patz和Junker的研究 实验一:2PLM,人数变化,题目固定。两参数Logistic模 结果。xq=J=lg分度参数及猜测度参数的建议分布的选取,本 型下,固定项目数及其参数,考察人数的增加对项目参数估 文均采用具有对称性且抽样相对简单的正态分布,与Patz和 计精度的影响。题数固定为60题,人数分别为100、200、 JunkerI 8I的所采用的非对称的对数正态分布和B分布不同, 500、1000、2000、3000、4000人,且共用同批项目参数。 但在算法上却大大简化了Patz和Junker的算法。 实验二:2PLM,被试固定,题数变化。两参数Logistic模 2.2实验设计 型下,固定被试数及其参数,考察题数的增加对被试参数估 为检验MCMC算法的可行性及估计的精确性,本研究 计精度的影响。人数固定为1000人,题数分别为lO、30、50、 采用Monet Carlo模拟方法,考察其估计的精确性并与E—M 100、150、200题,且共用同批被试参数。 万方数据