R !!!keyness *複数の文書からなるコーパスがあったとして、 *その中の特定の文書が、ほかの残りと比べて、際立って違う言葉遣いをしていることを探る。 *二種類の文書に対して行うことで、二つの文書の相違を観察できる。 **targetとreference group *符号付き2x2の関連性スコア(association score) quanteda::<> *target で、注目したい文書を指定する。 **数字を入れれば、文書行列中の要素番号 **ほかには、文書行列に、各文書の属性情報をつけて置き、その属性でグループを指定する。 ***例えば、JANとNTVという属性をつけて、JANをターゲットに指定して、残りのNTVと比較する。 *measure = オプションで統計値を選べる。(signed というのは、プラスマイナスの符号を使うから) ** chi2 は、χ二乗 ** exact は、Fisher's exact test ** lr は、likelihood ratio(G2)