R
!!!keyness
*複数の文書からなるコーパスがあったとして、
*その中の特定の文書が、ほかの残りと比べて、際立って違う言葉遣いをしていることを探る。
*二種類の文書に対して行うことで、二つの文書の相違を観察できる。
**targetとreference group

*符号付き２ｘ２の関連性スコア(association score)

quanteda::<<textstat_keyness(文書行列, target)>>
*target で、注目したい文書を指定する。
**数字を入れれば、文書行列中の要素番号
**ほかには、文書行列に、各文書の属性情報をつけて置き、その属性でグループを指定する。
***例えば、JANとNTVという属性をつけて、JANをターゲットに指定して、残りのNTVと比較する。
*measure = オプションで統計値を選べる。（signed というのは、プラスマイナスの符号を使うから）
** chi2 は、χ二乗
** exact は、Fisher's exact test
** lr は、likelihood ratio（G2）