!!!MI スコア !計算の仕方 +「strong tea」の共起頻度 +「strong」の頻度 +「tea」の頻度 +コーパスの総語数 MIスコア= log2((共起頻度×コーパス総語数)÷(片方の頻度×もう片方の頻度)) !特徴 *低頻度の単語によるまれな共起表現ほどスコアが大きく出る **分母が小さくなるので !Rのスクリプト {{ref MI.R}} *使い方 **このスクリプトをRで読み込んで、 **後は必要な頻度数と総語数を入れる。 共起表現xy頻度、単語xの頻度、単語yの頻度 コーパスの総語数N MI(xy, x, y, N)