!!!2. R による統計分析例

!!2.1 分散分析

!分散分析とは
*「分散」（バラツキ）を分析する
*データの「バラツキ」が、何らかの理由（要因）によるものなのか、偶然の誤差なのかを判定する。
*「要因」の数により、「一要因」から「三要因」まである。
*集めたデータが、一人の被験者からとった複数のデータ（「被験者内」） なのか、複数の被験者からとったデータ（「被験者間」）なのかを区別する。
*要因が複数ある場合は、「混合」（被験者内と被験者間）の場合もある。 

!分散分析の流れ
+分散分析をする
+交互作用があるか
++ない場合＝＞主効果が有意か
++ある場合＝＞交互作用の分析
+++主効果は意味がなくなる
+++単純主効果が有意か 
+３水準（条件）以上の有意な主効果もしくは交互作用があるか
++ない場合＝＞End
+++2水準で有意な場合、差があるのはどこなのかは明白なので、多重比較する必要はない。 
++ある場合＝＞多重比較（二つずつ条件を組み合わせて、実際に有意な 差があるのはどこかを見つける）
+++主効果が有意であった場合＝＞主効果の多重比較
+++交互作用が有意であった場合＝＞単純主効果の多重比較

![Rで分散分析はANOVA君できまり|http://riseki.php.xdomain.jp/index.php?ANOVA%E5%90%9B]
*[js-STAR|http://www.kisnet.or.jp/nappa/software/star/]と同じ使い勝手・説明
**[田中・山際 (1992)『ユーザーのための教育・心理統計と実験計画法―方法の理解から論文の書き方まで』|http://www.amazon.co.jp/dp/4316329014]で勉強できる。
**[中野・田中(2012)『フリーソフトjs-STARで かんたん統計データ分析』|http://www.amazon.co.jp/dp/4774150193/]
!anova君のインストール（Rで書かれたプログラムを読み込んで使う）
+anovakun というソースコードをダウンロードする
+Rのメニューからソースコードを読み込む
 source("http://riseki.php.xdomain.jp/index.php?plugin=attach&refer=ANOVA%E5%90%9B&openfile=anovakun_471.txt")

!分散分析のタイプと分析の手順
 分散分析のタイプ一覧
 
    Ａｓ(１要因参加者間)
    ｓＡ(１要因参加者内)
    ＡＢｓ(２要因参加者間)
    ＡｓＢ(２要因混合)
    ｓＡＢ(２要因参加者内)
    ＡＢＣｓ(３要因参加者間)
    ＡＢｓＣ(３要因混合)
    ＡｓＢＣ(３要因混合)
    ｓＡＢＣ(３要因参加者内)
+分析のタイプを決める。
++要因はいくつあるか
++それぞれの要因は「被験者内」か「被験者間」か（「対応のある」データか「対応のない」データか）
++それぞれの要因に「水準」はいくつあるか
++例
+++トレーニングをする前と後で成績が上がるか（一要因・被験者内・二水準）
+++トレーニングをする前と後、そして、しばらくしてからも効果が残るか（一要因・被験者内・三水準）
+++文学部、工学部、理学部で、英語の成績に差があるか（一要因・被験者間・三水準）
+++漢字の画数が多い熟語と少ない熟語で読む時間に差があるか（一要因・被験者内・二水準）
+++漢字の画数が多い熟語と少ない熟語で、実在する語と実在しない語とで、読む時間に差があるか（二要因・被験者内・２×２）
+++漢字の画数が多い熟語と少ない熟語を読むときに、日本語母語話者と学習者とで差があるか（二要因・混合・２×２）
+++漢字の画数が多い熟語と少ない熟語で、実在する語と実在しない語とで、日本語母語話者と学習者とで読む時間に差があるか（三要因・混合・２×２×２）
+<<分析にタイプに合わせてデータを整形する>>。
+データを読み込む。
+分析のタイプに合わせて、コマンドを実行する。

![ANOVA君の使い方|http://riseki.php.xdomain.jp/index.php?ANOVA%E5%90%9B%2FANOVA%E5%90%9B%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9]
 ３．データファイルの作成
*ポイント
**被験者内は、横に並べる
**被験者間は、縦に並べる

*[js-STARの形式を参考に|]
!分析の実例「事前・事後・遅延テストで、成績に差があるか？」

*対応のあるサンプルの場合：「<<2013test.xlsx>>」）を例に
*ポイントは、データをどういうフォーマットで並べた表を用意するか。

+同じ人から３種類のデータを取っているので「対応のあるデータ」（被験者内）（参加者内とも呼ぶ）
+要因は、タイミングだけなので、１要因（水準は三つ）
+タイプとしては　<<sA>>(１要因参加者内)　タイプ。
+被験者内なので、平均の差の標準誤差が等しいことを確認するために球面性検定を行う。
++その際に、もし有意だった場合、自動で自由度の補正を行うオプションをつける　<<auto=T>>
+コマンド
 anovakun(データ, "タイプ", 水準数, オプション)

*分析結果
{{ref anovakun-result.txt}}

!分析の実例２
*[杉浦・岩崎（2003）日本語学習者のための擬音語・擬態語学習用マルチメディアCALL教材の改善に向けて|http://www.gsid.nagoya-u.ac.jp/bpub/research/public/forum/23/01.pdf]
**マルチメディアCALL教材の学習効果を調べた。
***教材に含まれていて学習した項目（実験項目群）と教材に含まれていなかった項目（統制項目群）とで、学習の事前・事後・遅延で、成績に差があるか。
***結果
{{ref_image prepostdelayed.png}}
*サンプルデータ {{sugiura-iwasaki.xls}}

*分析
++実験項目群について、事前・事後・遅延の成績に差があるか？
++統制項目群について、事前・事後・遅延の成績に差があるか？
++実験項目群と統制項目群とで、事前・事後・遅延の成績に差があるか？


!!杉浦担当の授業に関しての課題
 上の「分析」の１と２をRを使ってやってみること。
 その手順と結果と考察をレポートにまとめること。
 評価のポイントは、
 １）分析手順がわかっているか、
 ２）結果のどこを見てどう判断すればよいかわかっているか、
 ３）結果について、自分で考察することができるか、
 という点を評価しますので、「わかっている」ということが、わかるように書いてください。
 枚数の制限は特に設けませんが、出てきた結果を、どこが必要か、どこは不要か、ということを
 考えずにただコピペして枚数を増やすというのはよくありません。
 必要なことを十分書いてください。
 
 「分析」の３まで、やれた人はボーナスポイントを付けます。
 授業の感想も、書いてくださいね。よろしく。