トップ 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

MOR

*disclaimer
178051

[CHILDES]

MOR


 準備

CLANの起動

MORの準備

  • CLANのメニューのFileから、Get MOR Grammarを選ぶ(英語を選択)
    • これを一度実行するとネット上から必要なファイルがデスクトップ上に保存される
      • 必要なファイルをPC内の別の場所に移動した場合は、Commands Window内のMor Libでその場所を指定すること

インストールされるプログラム

  1. MORで品詞タグの候補一覧
  2. POSTでそこから一つを選択
  3. POSTMORTEM
  4. MEGRASP



 出力される情報

形態素(品詞)タグ (%mor)

  • 形態素解析の精度は99.18%(成人英語母語話者の場合)
Currently, the most highly developed MOR grammar is the one for English, which 
achieves 99.18% accuracy in tagging for productions from adult native speakers in 
databases such as CHILDES and AphasiaBank. 

文法依存関係 (%gra)

  • 文法依存関係の精度は93%(成人英語母語話者の場合で、形態素解析が正しい場合)
Accuracy of grammatical 
relation tagging by GRASP is highly dependent on accurate tagging by MOR. However, 
even with accurate MOR tagging, GRASP tagging is at 93% accuracy for English.

 使い方

  • Commands Window内でコマンドを入力
    • メニューの「Winodw」から「Commands」を選ぶ

使用法: mor *.cha

  • コマンド一つで、一連のプログラムを実行

  1. 分析対象ファイルを一つのフォルダーにまとめる
  2. CLANのコマンドウィンドウでWorkingディレクトリーに分析対象フォルダーを指定

  1. mor *.cha を実行
  2. 一連のプログラムが実行され、品詞と依存関係の行がつく
    1. %mor行
    2. %gra行

認識されない単語がある場合

  • その部分の分析結果は不正確
  • /lexフォルダー内の 0allwords.cdcファイルで単語を確認・修正
  • 修正後、mor +xb *.cha コマンドを実行

無視する文字列

  • &で始まる文字列
  • 丸カッコで囲まれているポーズ (.) 等
  • 識別できない語 xxx, yyy, www
  • [ ] で記されているコード [/?], [/-], [/], [//], and [///].

各種設定ファイル (ENGフォルダー内)

ar.cut

異形態素の規則

cr.cut
形態素の組み合わせ規則
debug.cdc
デバッグ用
docs
説明文書
post.db
分析データベース
ex.cut
過剰生成されたものを除く(exclude)
lex
語彙リスト
sf.cut
特別(special)なマーカーの取り扱い