トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

t.test

t検定

前提: 正規分布をしているデータであること(ただし、判断は難しいので、現実的には以下を参考に、そうであると仮定して、という話になる)

  • 正規性の検定は、shapiro.test (Shapiro-Wilk検定)か ks.test(Kolmogorov-Smirnov(コルモゴロフ-スミルノフ)検定)をしてみる
  • ヒストグラムを見てみる。 hist(prepost$pre)
  • 尖度(せんど)と歪度(わいど)のいずれも±2の範囲に収まっているか確認してみる。
    • Rには標準ではコマンドがない。
    • たとえば以下のサイトのプログラムを使わせてもらう。

http://stat.biopapyrus.net/statistic/data-chracteristic.html

場合分け1:対応をしているデータか、対応していないデータか

  • その判断は、どうやってデータを取ったかをよく考えてみる
    • 一人の人から2回とったら「対応している」、別々の人からとったものを比べるなら「対応していない」

  • 対応をしているデータの場合、オプション , paired=Tをつける。
    • 対応しているデーの場合、等分散かどうかは考えなくてよい。

  • デフォルトは対応していない場合

場合分け2:等分散しているデータか、していないデータか

  • その判断は、等分散の検定F検定)をしてみればよいと思う人は、、、
    • 等分散をしている場合、オプション, var.equal=Tをつける。
    • 等分散をしていない場合、なにもつけなくてよい。

  • 等分散しているかどうかにかかわらず、等分散を仮定しないWelchの検定をすればよい、というのが青木先生の見解。

http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.html
分散が等しかろうと等しくなかろうと,最初からズバリ「等分散を仮定しない t 検定」を行うのが正しいやり方である。

t.test(hi, li)

        Welch Two Sample t-test

data:  hi and li 
t = -0.6747, df = 92.932, p-value = 0.5015
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -23.57668  11.61834 
sample estimates:
mean of x mean of y 
 357.3125  363.2917 

  • 何も指定しないと、「対応していない」「等分散を仮定しない」Welchのt検定

ということは結論的には、

  • 対応のあるデータの場合には、t.test(A, B, paird=T)
  • それ以外の場合は、t.test(A, B)

では、母集団が正規分布しているとは想定されない場合はどうするか、、、 => ノンパラメトリック検定