2014年9月9日火曜日

Maximalモデルを盲目的に仮定する問題

最近の心理言語学領域での混合モデル分析の使用法に関して議論になっている問題の一つが、ランダム要因の構成の決定法です。

2008年頃の議論では、最大限にランダムスロープを構成した後で、できるだけシンプルな構成になるように尤度比検定を行うことを推奨されていました。論文では、Baayen(2008)やJaeger(2009)などが引用されています。

一方、2012年に仮説上設定した要因にはランダムスロープを仮定した上で、確認的にモデルを検証するべきであるという議論がBarr et al.(2013)でなされました。この論文の出版以降、議論の主流は最大モデルを利用した確認的モデル検証に移っています。

しかし、何も考えずに最大モデルを想定することの意味について考えた方がいいかもしれません。Shravan Vasisthが彼のブログの中で、ランダム要因の構成方法に関するシミュレーションを実施しています。とても興味深い結果ですので、ぜひブログをお読みください。

http://vasishth-statistics.blogspot.jp/2014/08/an-adverse-consequence-of-fitting.html#links

2014年7月15日火曜日

夏季統計セミナーでの質問募集(締め切り延長)

先日紹介しました夏季統計セミナー(Summer Statistics Seminar)について再度お知らせします。

8月11日に東京大学駒場キャンパスで一日の統計セミナーを開催します。

午前中は線形混合モデルに関するQ&Aセッションを企画しており、

現在、何名かの方に混合モデル分析に関するお悩みご質問をいただいております。

例えば
研究デザインにあった解析方法(lmeの回帰方程式)はどうやって作ればいいか?
ランダム要因の決定に関する悩み
LME4の最近の動向

質問の受付締め切りは昨日でしたが、せっかくの機会ですので、締め切りを今月末31日までに延長いたします。

他の混合モデル分析ユーザーと知識を共有できるチャンスだと思いますので、参加申し込みと質問どうぞお送りください。

質問は
mixed.model.jp@gmail.com

参加申し込みは
http://yukihirose.com/Yuki/SSS2014.html


2014年7月1日火曜日

混合モデル分析に関する疑問・お悩み募集します

久しぶりの投稿です。
今回は8月に東京大学で開催される思考と言語研究会/MAPLL2014とその前日に開催されるSummer Statistics Seminar(SSS)のお知らせです。

毎年夏に電気情報学会の研究会である思考と言語研究会(TL)とMAPLLの合同ワークショップが開催されています。(研究発表の応募は既に締め切られています。)

毎年数多くの興味深い研究発表がありますが、今年の基調講演ではUniversity of PotsdamのSharavan Vasishthが線形混合モデルに関するチュートリアルを、そして、University of LiverpoolのFranklin Changがニューラルネットに関する講演をなさるそうです。

その他、プログラムはこちらをご覧ください。

そして、TL/MAPLLの前日には、言語科学における統計分析に焦点をあてたセミナーが実施されます。プログラムはこちらをご覧ください。

プログラムの中のQ&Aセッションは、当ブログも協力しています。そこで、あなたの混合モデル分析に関する疑問やお悩みを募集します。以下プログラムからの引用です。


LMEモデル(注:線形混合モデルのことです)は、t検定や分散分析と比較して、モデルの自由度が高く、研究デザインに合わせたモデルを構築できます。その一方で、その自由度の高さのために慎重なモデル選択が要求されます。よって、最終的なモデルを構築し、研究結果を報告するぎりぎりまで心配や悩みが絶えないと言うのもLMEモデルを用いた分析の特徴のひとつです。

そのようなLMEモデルの使用に関する疑問・悩みを他のLMEモデル使用者と共有して、解決策を一緒に探してみませんか?想定される質問は、モデルの構築方法や探索方法、パッケージやソフトウエアの選択、使用方法等ですが、LMEに関する質問ならなんでも受け付けます。受け付けた質問を取りまとめて当日の話題とする予定です。

応募が多数ある場合には、時間の都合で全ての質問を話題にできないこともありますが、その点はあらかじめご了承ください。

原則として、セッションで取り上げる質問を提出した方には当該セッションへの参加をお願いしますが、どうしてもセッション参加の都合が付かないという場合にも、質問は受け付けますのでご相談ください。

質問の送付方法:
以下のメールアドレスまで、お名前、所属、連絡先メールアドレス、質問内容をお送りください。

締め切りは7月14日です。沢山の疑問・悩みをお待ちしております。

2014年2月21日金曜日

「東大LMEワークショップ」午後の部レポート

先日告知をしました「東大LMEワークショップ」へ参加してきました。
本日は、午後のセッションの概要をご報告します。


1.混合効果モデル分析とt検定・分散分析との違い(神長伸幸)

これは、私の発表です。今回発表した内容は

  1. 混合効果モデルの基礎
  2. 固定要因、特にカテゴリー変数のコーディングについて
  3. ランダム要因、特にランダム切片とランダムスロープの相関について
  4. t検定・分散分析にはない5つのメリット
  5. 2011年以降の混合効果モデル分析の使用状況(出版された論文数による)
  6. 混合効果モデル分析を学ぶポイント
でした。特に上記3では混合効果モデルのメリットとして

  1. 複数のランダム要因を細かく設定できる
  2. 連続量の予測変数をそのままモデルに組み込める
  3. 正規分布以外の分布を持つ従属変数を分析できる
  4. 従属変数に影響しそうな要因を共変量としてモデルに組み込める
  5. 欠損値を含むデータを分析できる
ことを挙げました。また上記6に関して。混合効果モデル分析は、t検定・分散分析から2段階の拡張をしています。ですので、第1の拡張としての線形モデルで学べる内容と第2の拡張としての混合効果モデルで学べる内容を上手く区別した方がいいと指摘しました。

2.Analyzing Reading Time Data with Linear Mixed Effects Regression Models (Doug Roland先生)

混合効果モデル分析を使って既に何本も国際論文誌に論文を載せているRoland先生の発表です。分析の手順や必要なパッケージを示してくれただけでなく、混合効果モデルを読み時間データの分析に使おうとしている人なら、誰でも悩むような問題を取り上げていました。


  1. どうやってはずれ値データを取り除くのか?
  2. ランダム要因の構造をどうやって決めるべきか?
  3. 予測変数は中心化を施すべきか?
  4. 反応時間を対数変換すべきか?
  5. p値をどうやって計算するか?
Roland先生は、それぞれの疑問について、可能な答えのオプションを示しながら、自分ならどれを選ぶかまで説明されていました。こういう悩みに答えてくれる発表は本当に参考になります。

3.眼球運動データの線形混合モデル解析(新井学先生)

眼球運動測定を利用した心理言語学研究で、国際論文誌にどんどん論文を載せている新井先生からは、言語研究における眼球運動研究の基礎と眼球運動データを混合効果モデルで分析する際のポイントについて解説がありました。

特に、視覚世界パラダイムと呼ばれる比較的新しい手法の眼球運動測定実験では、視覚文脈内の特定のオブジェクトをあらかじめ決めた時間帯に見ているか否かを検証します。そのようなデータは、定義上、正規分布をとらないため、一般化線形混合効果モデルを利用しなければなりません。新井先生からは、エンピリカルロジットという対数オッズの計算方法の紹介やランダム要因の構造の決め方に関する実践的な発表がありました。

Roland先生と新井先生の発表はどちらも査読に耐える解析とは何かをご自身の経験から解説してくれたことが印象的でした。このような勉強会がこれからもどんどん開かれるといいなと思いました。


2014年2月11日火曜日

LMEワークショップ 於東京大学駒場キャンパス 午前の部チュートリアル受付終了

先日告知しました、線形混合モデルに関するワークショップについて追加連絡です。オーガナイザーの山田さんより、午前の部のチュートリアルの受付が締め切りましたと連絡がありました。午後の部のレクチャーは、引き続き参加可能とのことです。以下、山田さんからの連絡です。
(2月18日追記:主催者から連絡があり、レクチャーのタイトルなどを修正しました)



各位

東京大学大学院総合文化研究科言語情報科学専攻博士課程所属の山田敏幸と申します。

今週木曜日、220日(木)に「東大LMEワークショップ」を開催いたします。

午前の部はすでに受付終了ですが、午後の部は事前予約不要ですので、ご関心のおありの方は是非ご参加ください。


以下、リマインダです。

言語情報科学専攻設立20周年記念卓越拠点研究補助金企画である、

「言語研究における統計処理の研究:線形混合モデルLMEを中心に」主催でワークショップを開催いたします。

日にち:2014年2月20日(木)

時間:10:00-17:00

場所:東京大学駒場キャンパス情報教育棟4階中演習室2 (E42)

入場無料、予約(午前の部:受付終了、午後の部:不要)

★本ワークショップの目的

 近年、言語研究において統計処理のパラダイムシフトが起こりつつあります。具体的には、分散分析ANOVAから線形混合モデルLMEへの移行です。過渡期である今、「線形混合モデルとは何か?」「ANOVAよりもLMEの方が有用なのか?」などの疑問を、実践をとして議論していくことが求められています。本ワークショップは、午前の部(チュートリアル編)と午後の部(LMEレクチャー編)に分かれています。午前の部では、LMEの簡単な実践をしていただき、ANOVAとの類似点・相違点に気づいてもらうことを目的とします。午後の部では、LMEを実際の研究に応用している講師の先生をお招きし、LMEの有用性、理論的・実践的問題点などの話題提供をしていただき、LMEを今後深く理解するための橋渡しを目的とします。

☆午前の部:チュートリアル編(受付終了)

10:00-12:00 チュートリアル

☆午後の部:LMEレクチャー編

 午後の部では、講師の先生を招き、言語心理学研究における主要な手法である、自己ペース読み課題、眼球運動課題におけるデータをLMEでいかに扱うことができるのか講義していただきます。その話題提供を受け、フロアとのディスカッションをとおして、LMEに対する理解を深めます。

13:30-14:00 イントロダクション:混合効果モデル分析とt検定・分散分析との違い
      神長伸幸  先生

14:10-15:00 レクチャー1:Analyzing reading time data with mixed effects models
         Roland, Douglas 先生 (使用言語:英語)

15:20-16:10 レクチャー2:眼球運動データの線形混合モデル解析
      新井 学 先生

16:20-17:00 フロアとのディスカッション

こちらは、事前予約不要です。会場に直接お越しください。

なお、会場は飲食禁止ですので、どうぞご了承ください。

★本ワークショップにご質問のある方は、下記までご連絡ください。

東京大学大学院総合文化研究科言語情報科学専攻博士課程
山田 敏幸
t_yamada@phiz.c.u-tokyo.ac.jp

















2014年2月4日火曜日

LMEワークショップ 於東京大学駒場キャンパス

しばらく更新をお休みしていました。
本日は、東京大学言語情報科学専攻が主催する線形混合モデルワークショップのお知らせを掲載します。
午前中はチュートリアル、午後は口頭発表が予定されているようです。
本ブログに関連したワークショップは、これまで仙台、大阪で開催されており、東京では開催していません。つまり、首都圏ではめったにないチャンスですので、興味のある方は、ぜひ主催者へ直接参加申し込み、お問い合わせください。

以下主催者からいただいたメールを転載します。

各位
東京大学大学院総合文化研究科言語情報科学専攻博士課程所属の山田敏幸と申します。
開催まで1ヶ月を切っての周知で大変恐縮ではございますが、
2月20日(木)に開催するワークショップについてお知らせさせていただきます。
言語情報科学専攻設立20周年記念卓越拠点研究補助金企画である、
「言語研究における統計処理の研究:線形混合モデルLMEを中心に」主催でワークショップを開催いたします。
日にち:2014年2月20日(木)
時間:10:00-17:00
場所:東京大学駒場キャンパス
入場無料、予約(午前の部:必要、午後の部:不要)

会場など詳細は追って連絡いたします

★本ワークショップの目的
 近年、言語研究において統計処理のパラダイムシフトが起こりつつあります。具体的には、分散分析ANOVAから線形混合モデルLMEへの移行です。過渡期である今、「線形混合モデルとは何か?」「ANOVAよりもLMEの方が有用なのか?」などの疑問を、実践をとして議論していくことが求められています。本ワークショップは、午前の部(チュートリアル編)と午後の部(LMEレクチャー編)に分かれています。午前の部では、LMEの簡単な実践をしていただき、ANOVAとの類似点・相違点に気づいてもらうことを目的とします。午後の部では、LMEを実際の研究に応用している講師の先生をお招きし、LMEの有用性、理論的・実践的問題点などの話題提供をしていただき、LMEを今後深く理解するための橋渡しを目的とします。


☆午前の部:チュートリアル編
 午前の部では、統計処理ソフトRを使い、言語心理学研究で扱う主要なデータとして読み時間の分析を、線形混合モデルを用いて行ないます。主に本企画メンバーがチューターを務め、実践的な練習の場とします。

10:00-12:00 チュートリアル「Rで読み時間データをLMEで分析してみよう」

こちらは、事前予約が必要です(先着15名)。
誠に勝手ではございますが、参加者を以下に限定させていただきます。
参加対象者:RANOVAの実践があり、当日自身でRを使用できる環境が準備できる方。


☆午後の部:LMEレクチャー編
 午後の部では、講師の先生を招き、言語心理学研究における主要な手法である、自己ペース読み課題、眼球運動課題におけるデータをLMEでいかに扱うことができるのか講義していただきます。その話題提供を受け、フロアとのディスカッションをとおして、LMEに対する理解を深めます。

13:00-13:30 イントロダクション:LMEANOVA、何が違うのか?
13:40-14:40 レクチャー1:読み時間データをLMEで扱う(Roland, Douglas先生)
15:00-16:00 レクチャー2:眼球運動データをLMEで扱う(新井 先生)
16:10-17:00 フロアとのディスカッション

こちらは、事前予約不要です。会場に直接お越しください。


★午前の部に参加をご希望される方、また本ワークショップにご質問のある方は、下記までご連絡ください。
ご関心のおありの方は是非ご参加ください。
東京大学大学院総合文化研究科言語情報科学専攻博士課程
山田 敏幸
t_yamada@phiz.c.u-tokyo.ac.jp

2014年2月7日23時 追記
午前の部のチュートリアルの受付について、残り席数がわずかのようです。参加予定だが申し込みがまだの方や、やってみようか迷っている方はお早めにどうぞ。


2013年7月12日金曜日

第2回 混合モデル分析ワークショップ開催のお知らせ

第2回混合モデル分析ワークショップを以下の日程で開催いたします。

日時 2013年8月2日12:30~17:00
場所 関西学院大学梅田キャンパス

今回はワークショップの参加に事前登録が必要ですが、申込み済み参加者が多数のため
参加募集を終了しております。ご注意ください。

第2回のワークショップの目的は「参加者の皆様にR言語等を用いてデータを解析していただくこと」です。実際のデータ解析を体験することで解析の手続きやコツを学んでいただければと思っております。

ワークショップの概要は後日、本ブログでご報告いたします。