*disclaimer
603120
[CHILDES]
MOR
準備
CLANの起動
MORの準備
- CLANのメニューのFileから、Get MOR Grammarを選ぶ(英語を選択)
- これを一度実行するとネット上から必要なファイルがデスクトップ上に保存される
- 必要なファイルをPC内の別の場所に移動した場合は、Commands Window内のMor Libでその場所を指定すること
- これを一度実行するとネット上から必要なファイルがデスクトップ上に保存される
インストールされるプログラム
- MORで品詞タグの候補一覧
- POSTでそこから一つを選択
- POSTMORTEM
- MEGRASP
出力される情報
形態素(品詞)タグ (%mor)
- 形態素解析の精度は99.18%(成人英語母語話者の場合)
Currently, the most highly developed MOR grammar is the one for English, which achieves 99.18% accuracy in tagging for productions from adult native speakers in databases such as CHILDES and AphasiaBank.
文法依存関係 (%gra)
- 文法依存関係の精度は93%(成人英語母語話者の場合で、形態素解析が正しい場合)
Accuracy of grammatical relation tagging by GRASP is highly dependent on accurate tagging by MOR. However, even with accurate MOR tagging, GRASP tagging is at 93% accuracy for English.
使い方
- Commands Window内でコマンドを入力
- メニューの「Winodw」から「Commands」を選ぶ
使用法: mor *.cha
- コマンド一つで、一連のプログラムを実行
- 分析対象ファイルを一つのフォルダーにまとめる
- CLANのコマンドウィンドウでWorkingディレクトリーに分析対象フォルダーを指定
- mor *.cha を実行
- 一連のプログラムが実行され、品詞と依存関係の行がつく
- %mor行
- %gra行
認識されない単語がある場合
- その部分の分析結果は不正確
- /lexフォルダー内の 0allwords.cdcファイルで単語を確認・修正
- 修正後、mor +xb *.cha コマンドを実行
無視する文字列
- &で始まる文字列
- 丸カッコで囲まれているポーズ (.) 等
- 識別できない語 xxx, yyy, www
- [ ] で記されているコード [/?], [/-], [/], [//], and [///].
各種設定ファイル (ENGフォルダー内)
- ar.cut
異形態素の規則
- cr.cut
- debug.cdc
- docs
- post.db
- ex.cut
- lex
- sf.cut
https://sugiura-ken.org/wiki/