*disclaimer
603410
#LancsBox
http://corpora.lancs.ac.uk/lancsbox/index.php
インストールまで
起動
- 左の「load data」の「Corpus」をクリックする
- ウィンドウが開くので、読み込むテキストファイル選択(同時に複数も可)
- 読み込むと同時にタグ付けされ(左下の欄外注目)、読み込みが終わると、右下のペインにファイル一覧が表示される。
JPN501.txt Format: Text, 858 tokens, 255 types, 246 lemmas
検索 KWIC
- 上のメニューから「KWIC」を選択
- すぐ下に検索欄が出るので、検索文字列を入れて「Search」ボタンを押す
- 検索文字列を中心に「Node」となり、左右の文脈が表示される。
- 詳しく見たい該当行をダブルクリックすると、元のファイルがウィンドウで表示される。
検索 GraphColl
- キーワードを入れて「Search」する
- キーワードを中心に左右に来る単語の頻度一覧とともに、右にその語を中心としたグラフが表示される。
- 単語の頻度一覧は見出し部分をクリックすることで、左右でソートできる
Ngrams
- 上のメニューの「Ngrams」をクリックすると
- n-gram一覧を作成してくれる。
- n-gram一覧表のウィンドウのメニューの右端の「▼Grams」をクリックすると
- グラム数をスライドバーで選ぶことができ、選ぶと、該当する表現の一覧表を提示してくれる。
https://sugiura-ken.org/wiki/