t.test

t検定

TOP ↑ ↓

前提：　正規分布をしているデータであること（ただし、判断は難しいので、現実的には以下を参考に、そうであると仮定して、という話になる）

TOP ↑ ↓

正規性の検定は、shapiro.test （Shapiro-Wilk検定）か ks.test（Kolmogorov-Smirnov（コルモゴロフ-スミルノフ）検定）をしてみる
ヒストグラムを見てみる。 hist(prepost$pre)

尖度（せんど）と歪度（わいど）のいずれも±２の範囲に収まっているか確認してみる。
- Rには標準ではコマンドがない。
- たとえば以下のサイトのプログラムを使わせてもらう。

http://stat.biopapyrus.net/statistic/data-chracteristic.html

場合分け１：対応をしているデータか、対応していないデータか

TOP ↑ ↓

その判断は、どうやってデータを取ったかをよく考えてみる
- 一人の人から2回とったら「対応している」、別々の人からとったものを比べるなら「対応していない」

対応をしているデータの場合、オプション , paired=Tをつける。
- 対応しているデーの場合、等分散かどうかは考えなくてよい。

デフォルトは対応していない場合

場合分け２：等分散しているデータか、していないデータか

TOP ↑ ↓

その判断は、等分散の検定（F検定）をしてみればよいと思う人は、、、
- 等分散をしている場合、オプション, var.equal=Tをつける。
- 等分散をしていない場合、なにもつけなくてよい。

等分散しているかどうかにかかわらず、等分散を仮定しないWelchの検定をすればよい、というのが青木先生の見解。

http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html
「分散が等しかろうと等しくなかろうと，最初からズバリ「等分散を仮定しない t 検定」を行うのが正しいやり方である。」

t.test(hi, li)

        Welch Two Sample t-test

data:  hi and li 
t = -0.6747, df = 92.932, p-value = 0.5015
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -23.57668  11.61834 
sample estimates:
mean of x mean of y 
 357.3125  363.2917

何も指定しないと、「対応していない」「等分散を仮定しない」Welchのt検定

ということは結論的には、

TOP ↑ ↓

対応のあるデータの場合には、t.test(A, B, paired=T)
それ以外の場合は、t.test(A, B)

検定の結果を保存して、その中から、各種値を取ることができる。

TOP ↑ ↓

> t.test(kimatu$koku, kimatu$suu, paired=TRUE)

        Paired t-test

data:  kimatu$koku and kimatu$suu
t = -2.327, df = 19, p-value = 0.03118
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -11.6057412  -0.6142588
sample estimates:
mean of the differences 
                  -6.11 

> result.t <- t.test(kimatu$koku, kimatu$suu, paired=TRUE)
> result.t$statistic
        t 
-2.326961 
> 
> result.t$p.value
[1] 0.03117772
> result.t$parameter
df 
19 
> result.t$estimate
mean of the differences 
                  -6.11

では、母集団が正規分布しているとは想定されない場合はどうするか、、、＝＞　ノンパラメトリック検定

TOP ↑ ↓

t検定

前提：　正規分布をしているデータであること（ただし、判断は難しいので、現実的には以下を参考に、そうであると仮定して、という話になる）

場合分け１：対応をしているデータか、対応していないデータか

場合分け２：等分散しているデータか、していないデータか

ということは結論的には、

検定の結果を保存して、その中から、各種値を取ることができる。

では、母集団が正規分布しているとは想定されない場合はどうするか、、、＝＞　ノンパラメトリック検定

https://sugiura-ken.org/wiki/

Menu

keyword

category

更新履歴