!!!t検定 !前提: 正規分布をしているデータであること(ただし、判断は難しいので、現実的には以下を参考に、そうであると仮定して、という話になる) *正規性の検定は、shapiro.test (Shapiro-Wilk検定)か ks.test(Kolmogorov-Smirnov(コルモゴロフ-スミルノフ)検定)をしてみる *ヒストグラムを見てみる。 hist(prepost$pre) {{ref_image hist(pre).jpg}} *尖度(せんど)と歪度(わいど)のいずれも±2の範囲に収まっているか確認してみる。 **Rには標準ではコマンドがない。 **たとえば以下のサイトのプログラムを使わせてもらう。 http://stat.biopapyrus.net/statistic/data-chracteristic.html !場合分け1:対応をしているデータか、対応していないデータか *その判断は、どうやってデータを取ったかをよく考えてみる **一人の人から2回とったら「対応している」、別々の人からとったものを比べるなら「対応していない」 *対応をしているデータの場合、オプション <<, paired=T>>をつける。 **対応しているデーの場合、等分散かどうかは考えなくてよい。 *デフォルトは対応していない場合 !場合分け2:等分散しているデータか、していないデータか *その判断は、等分散の検定(F検定)をしてみればよいと思う人は、、、 **等分散をしている場合、オプション<<, var.equal=T>>をつける。 **等分散をしていない場合、なにもつけなくてよい。 *等分散しているかどうかにかかわらず、等分散を仮定しないWelchの検定をすればよい、というのが青木先生の見解。 http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html 「<<分散が等しかろうと等しくなかろうと,最初からズバリ「等分散を仮定しない t 検定」を行うのが正しいやり方である。 >>」 t.test(hi, li) Welch Two Sample t-test data: hi and li t = -0.6747, df = 92.932, p-value = 0.5015 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -23.57668 11.61834 sample estimates: mean of x mean of y 357.3125 363.2917 *何も指定しないと、「対応していない」「等分散を仮定しない」Welchのt検定 !ということは結論的には、 *対応のあるデータの場合には、t.test(A, B<<, paired=T>>) *それ以外の場合は、t.test(A, B) !検定の結果を保存して、その中から、各種値を取ることができる。 {{pre > t.test(kimatu$koku, kimatu$suu, paired=TRUE) Paired t-test data: kimatu$koku and kimatu$suu t = -2.327, df = 19, p-value = 0.03118 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -11.6057412 -0.6142588 sample estimates: mean of the differences -6.11 > result.t <- t.test(kimatu$koku, kimatu$suu, paired=TRUE) > result.t$statistic t -2.326961 > > result.t$p.value [1] 0.03117772 > result.t$parameter df 19 > result.t$estimate mean of the differences -6.11 }} !!では、母集団が正規分布しているとは想定されない場合はどうするか、、、 => ノンパラメトリック検定