*disclaimer
1198848
dummy variables ダミー変数 dummy coding ダミーコーディング
自動
- カテゴリー変数は型がfactorになっていれば、自動的にダミー変数として処理
基準のレベルを指定する場合
- 例:指定しないと、1年生が基準になるところ、2年生を基準にしたい場合
df$a <- factor(df$a, levels = c("2年生", "1年生", "3年生"))
値を指定する場合
- 二つの場合
- 0と1 もしくは、-0.5と0.5
- 三つの場合:事前、事後、遅延
- 0と1を二つ組み合わせて
| 種類 | 事後 | 遅延 |
|---|---|---|
| 事前 | 0 | 0 |
| 事後 | 1 | 0 |
| 遅延 | 0 | 1 |
自動で割り振ってくれる関数
> contr.helmert(3) [,1] [,2] 1 -1 -1 2 1 -1 3 0 2 > contr.treatment(3) 2 3 1 0 0 2 1 0 3 0 1
切片が参照カテゴリーの平均値を表す
- それを基準として他の水準を解釈できる
https://sugiura-ken.org/wiki/