http://www2.nict.go.jp/univ-com/multi_trans/member/mutiyama/manual/index-ja.html
corpus
2011年度「学習者コーパス論」でR
講義ノート改訂版公開。 http://sugiura-ken.org/wiki/wiki.cgi/exp?page=R
new interface for the Corpus of Contemporary American English (COCA)
http://www.wordandphrase.info Mark Daviesさん、これ、一人でやってるんだからすごいなぁ。
「書き言葉コーパスの利用許諾料は、52,500 円(税込)とする。」
https://chunagon.ninjal.ac.jp/utility/terms 『現代日本語書き言葉均衡コーパス』 DVD版(アカデミック利用)
Susan Hunston 氏講演会
先週土曜日に行ってきましたが、帰ってきたと思ったら、もう一週間過ぎてしまった。 日時:2011年11月26日(土)午後2時30分-午後4時30分 場所: キャンパスプラザ京都 5 階第 2 -第 4 演習室 ※京都駅北…
N-GRAMS from the COCA and COHA corpora of American English
http://www.ngrams.info/
『現代日本語書き言葉均衡コーパス』
(BCCWJ:Balanced Corpus of Contemporary Written Japanese) 「現代の日本語の書き言葉の全体像を把握できるように集められたサンプルが約1億語収録されています。」 htt…
「学習者コーパス論」講義ノート:Rによるテキスト処理入門
あ、これ、もう公開してます。 「学習者コーパス論」講義ノート:Rによるテキスト処理入門 * 担当:杉浦正利 * TA:小島ますみ o R2009fall.pdf
Open American National Corpus
http://americannationalcorpus.org/OANC/ American National Corpus がOpenになっている。
500,000 word list
http://www.wordfrequency.info/ 前は、5000語だったのが、一気に百倍。(ただし、レマ化なし) Corpus of Contemporary American English(4億1千万…
International Corpus of Learner English v2 (ICLE2)
http://www.uclouvain.be/en-277586.html これが、どのくらいデータとして質が良くなっているかですね。
ELRA
European Language Resources Association http://www.elra.info/
BNC Simple Search
http://www.natcorp.ox.ac.uk/using/index.xml?ID=simple
Word frequency lists and dictionary
http://www.wordfrequency.info/ アメリカ英語の語彙頻度に関するサイト
4億語のアメリカ英語のコーパス
The Corpus of Contemporary American English as the first reliable monitor corpus of English. Mark Davies. Lit …