*disclaimer
493888
pwr
検定力 = 1 - β
- βとは、第二種の過誤(Type II error)、つまり、有意差が無いとは言えないのに無いといってしまう誤り(false negative)
- positiveなのに、間違ってnegativeと判断。(検出漏れ)
- 誤りは少ない方が良い
- 1 - βの値は、大きい方が良い。(1から引くので最大1)
- サンプルサイズが大きいと有意になりやすい
- たった2センチの差でも、3人では偶然かもしれないが、3万人調べて差があるなら、差がないとは言えないでしょう。
- サンプルサイズが小さいと有意になりにくい
- 3人しか見てないんだから、偶然でしょ、と言われてしまう。
- 大規模な実験ができなくて、小人数しか参加者が集められなかった場合、
- 検定をしても有意にならなかった、という結論になってしまっても、
- 有意にならなかったのは、サンプルサイズが小さかったからかもしれない、だから、今後の課題として、数を増やして、とよく言うが、
- だったら、最初から、必要な数のサンプルを集めてから分析したらよいでしょ、と言われるわけだ。
効果量・サンプルサイズ・検定力(0.8)・有意水準(0.5)の関係
インストール
install.packages("pwr") library(pwr)
説明
https://cran.r-project.org/web/packages/pwr/vignettes/pwr-vignette.html
使用可能な関数
pwr.t.test: t検定 (two-sample, one-sample and paired t-tests) pwr.t2n.test: two-sample t-tests (比較する二群の数が違う場合) pwr.p.test: one-sample proportion test pwr.2p.test: two-sample proportion test pwr.2p2n.test: two-sample proportion test (比較する二群の数が違う場合) pwr.anova.test: one-way balanced ANOVA pwr.r.test: correlation test pwr.chisq.test: chi-squared test (goodness of fit and association) pwr.f2.test: test for the general linear model
可視化
出力をplotするだけ
サンプルサイズ
p1 一つ目の確率 p2 二つ目の確率 sig.level 有意水準 power 検出力(%) alternative 両側・片側
これで、出てくるnの値が必要なサンプル数
使用例
2群の平均値の差の検定 t検定
- 効果量 0.8
- 検定力 0.8
- 危険率 0.05
pwr.t.test(d=0.8, power=0.8, sig.level=0.05) Two-sample t test power calculation n = 25.52458 d = 0.8 sig.level = 0.05 power = 0.8 alternative = two.sided NOTE: n is number in *each* group plot(pwr.t.test(d=0.8, power=0.8, sig.level=0.05))
- 比較の各グループのサンプルサイズは26が最適
サイズの違う二群のt検定
- 効果量 0.8
- 二群の数 14, 18
pwr.t2n.test(d=0.8, n1 = 14, n2 = 18)
https://sugiura-ken.org/wiki/