2012年12月17日月曜日

R言語を用いた混合モデル解析の紹介その1:1要因デザインの場合(5)


2-2. 簡略モデルによる推定と最大モデルとの比較

 混合モデル解析では、ランダム因子の構造について複数の可能性があります。そこでデータに対する適合度を指標として「適合度が最大」かつ「もっとも単純な」構造のモデルを最終モデルとして選択します。まずは上記の最大モデルから項目のランダム因子のスロープを取り除いたモデルで推定します。

model.2 = lmer(RT ~ CondDummy + ( 1 + CondDummy | Subject) + (1 | Item))

このモデルの推定結果は以下のようになります。
summary(model.2)


Linear mixed model fit by REML 
Formula: RT ~ CondDummy + (1 + CondDummy | Subject) + (1 | Item) 
  AIC  BIC logLik deviance REMLdev
 1047 1067 -516.3     1040    1033
Random effects:
 Groups   Name        Variance Std.Dev. Corr  
 Subject  (Intercept) 429.6527 20.7281        
          CondDummy     4.0436  2.0109  0.149 
 Item     (Intercept)    66.2690  8.1406        
 Residual                   42.6313  6.5293        
Number of obs: 144, groups: Subject, 12; Item, 12

Fixed effects:
                   Estimate Std. Error t value
(Intercept)      400.292      6.474   61.83
CondDummy     48.153      1.233   39.04

Correlation of Fixed Effects:
                    (Intr)
CondDummy -0.009


 次にmodel.maxとmodel.2を比較します。モデルの単純さという点では、model.2がランダム因子のスロープを除いた分(パラメータ数では2減っています)だけ優っています。あとは適合度を比べてmodel.2とmodel.maxが同程度の適合度なのか、それともmodel.maxの方が適当度が有意に高いのかを検証します。検証にはanova()というコマンドを用います。

anova(model.max, model.2)

Models:
model.2: RT ~ CondDummy + (1 + CondDummy | Subject) + (1 | Item)
model.max: RT ~ CondDummy + (1 + CondDummy | Subject) + (1 + CondDummy | 
model.max:     Item)
              Df    AIC    BIC  logLik      Chisq Chi Df Pr(>Chisq)  
model.2      7 1054.4 1075.2 -520.22                           
model.max  9 1053.7 1080.4 -517.84  4.7645      2    0.09234 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

 出力結果の下から3行目を見るとChisqが4.7645、自由度(Df)が2 Pr(>Chisq)が0.09234とあります。Chisqは各モデルの対数尤度の差の2倍の値です。自由度はパラメータ数の差になっています。P値はこの二つの値から求められており、model.maxはmodel.2よりも有意に適合度が高いとは
言えないことが示されました。ということで暫定的にmodel.2を採用します。

(6)へ続く

0 件のコメント:

コメントを投稿