*disclaimer
1198489
t検定
前提: 正規分布をしているデータであること(ただし、判断は難しいので、現実的には以下を参考に、そうであると仮定して、という話になる)
- 正規性の検定は、shapiro.test (Shapiro-Wilk検定)か ks.test(Kolmogorov-Smirnov(コルモゴロフ-スミルノフ)検定)をしてみる
- ヒストグラムを見てみる。 hist(prepost$pre)
- 尖度(せんど)と歪度(わいど)のいずれも±2の範囲に収まっているか確認してみる。
- Rには標準ではコマンドがない。
- たとえば以下のサイトのプログラムを使わせてもらう。
http://stat.biopapyrus.net/statistic/data-chracteristic.html
場合分け1:対応をしているデータか、対応していないデータか
- その判断は、どうやってデータを取ったかをよく考えてみる
- 一人の人から2回とったら「対応している」、別々の人からとったものを比べるなら「対応していない」
- 対応をしているデータの場合、オプション , paired=Tをつける。
- 対応しているデーの場合、等分散かどうかは考えなくてよい。
- デフォルトは対応していない場合
場合分け2:等分散しているデータか、していないデータか
- 等分散しているかどうかにかかわらず、等分散を仮定しないWelchの検定をすればよい、というのが青木先生の見解。
http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html
「分散が等しかろうと等しくなかろうと,最初からズバリ「等分散を仮定しない t 検定」を行うのが正しいやり方である。 」
t.test(hi, li)
Welch Two Sample t-test
data: hi and li
t = -0.6747, df = 92.932, p-value = 0.5015
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-23.57668 11.61834
sample estimates:
mean of x mean of y
357.3125 363.2917
- 何も指定しないと、「対応していない」「等分散を仮定しない」Welchのt検定
ということは結論的には、
検定の結果を保存して、その中から、各種値を取ることができる。
> t.test(kimatu$koku, kimatu$suu, paired=TRUE)
Paired t-test
data: kimatu$koku and kimatu$suu
t = -2.327, df = 19, p-value = 0.03118
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-11.6057412 -0.6142588
sample estimates:
mean of the differences
-6.11
> result.t <- t.test(kimatu$koku, kimatu$suu, paired=TRUE)
> result.t$statistic
t
-2.326961
>
> result.t$p.value
[1] 0.03117772
> result.t$parameter
df
19
> result.t$estimate
mean of the differences
-6.11
https://sugiura-ken.org/wiki/