*disclaimer
631814
t検定
前提: 正規分布をしているデータであること(ただし、判断は難しいので、現実的には以下を参考に、そうであると仮定して、という話になる)
- 正規性の検定は、shapiro.test (Shapiro-Wilk検定)か ks.test(Kolmogorov-Smirnov(コルモゴロフ-スミルノフ)検定)をしてみる
- ヒストグラムを見てみる。 hist(prepost$pre)
- 尖度(せんど)と歪度(わいど)のいずれも±2の範囲に収まっているか確認してみる。
- Rには標準ではコマンドがない。
- たとえば以下のサイトのプログラムを使わせてもらう。
http://stat.biopapyrus.net/statistic/data-chracteristic.html
場合分け1:対応をしているデータか、対応していないデータか
- その判断は、どうやってデータを取ったかをよく考えてみる
- 一人の人から2回とったら「対応している」、別々の人からとったものを比べるなら「対応していない」
- 対応をしているデータの場合、オプション , paired=Tをつける。
- 対応しているデーの場合、等分散かどうかは考えなくてよい。
- デフォルトは対応していない場合
場合分け2:等分散しているデータか、していないデータか
- 等分散しているかどうかにかかわらず、等分散を仮定しないWelchの検定をすればよい、というのが青木先生の見解。
http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html
「分散が等しかろうと等しくなかろうと,最初からズバリ「等分散を仮定しない t 検定」を行うのが正しいやり方である。 」
t.test(hi, li) Welch Two Sample t-test data: hi and li t = -0.6747, df = 92.932, p-value = 0.5015 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -23.57668 11.61834 sample estimates: mean of x mean of y 357.3125 363.2917
- 何も指定しないと、「対応していない」「等分散を仮定しない」Welchのt検定
ということは結論的には、
検定の結果を保存して、その中から、各種値を取ることができる。
> t.test(kimatu$koku, kimatu$suu, paired=TRUE) Paired t-test data: kimatu$koku and kimatu$suu t = -2.327, df = 19, p-value = 0.03118 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -11.6057412 -0.6142588 sample estimates: mean of the differences -6.11 > result.t <- t.test(kimatu$koku, kimatu$suu, paired=TRUE) > result.t$statistic t -2.326961 > > result.t$p.value [1] 0.03117772 > result.t$parameter df 19 > result.t$estimate mean of the differences -6.11
https://sugiura-ken.org/wiki/