Blog Sugiura

Enjoy

JSON

sugiura, · カテゴリー: memo, program

https://www.json.org/json-ja.html

フォーマットの一般化・共通化の一例

発想はXMLと逆

値にタグをつけるのがXML
名前(タグ)に値をつけていくのがJSON

TreeTagger

sugiura, · カテゴリー: program

http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/

Perl必要
パラメターファイル必要

環境変数PATHに C:\TreeTagger\bin を追加(再起動必要)

そのbinの中にある tag-english.bat を

tag-english ファイル

で実行。tag-englishではわかりにくいので、treetag という名前にでも変えておくとわかりやすいでしょう。
そこまでいけばあとは、

treetag 形態素解析したいテキストファイル名

で、oK

koRpus text analysis

sugiura, · カテゴリー: memo, program · タグ:

https://ripley.psycho.hhu.de/koRpus/

shiny packageをつかってるんだ。

quanteda

sugiura, · カテゴリー: program, 未分類 · タグ:

https://quanteda.io/

使用例

> kwic(body.tmp, “is”)

[text8, 7] you play BUDO, there | is | an important thing that you
[text9, 2] It | is | " REI".
[text10, 6] First," REI" | is | the feeling that you thank
[text14, 2] This | is | the expression that players thank
[text15, 6] Secondly," REI" | is | the felling that you thank
[text18, 6] Finally," REI" | is | the feeling that you thank
[text27, 2] This | is | the same good point which

polyglot

sugiura, · カテゴリー: memo, program

http://polyglot.readthedocs.io/en/latest/

Tokenization (165 Languages)
Language detection (196 Languages)
Named Entity Recognition (40 Languages)
Part of Speech Tagging (16 Languages)
Sentiment Analysis (136 Languages)
Word Embeddings (137 Languages)
Morphological analysis (135 Languages)
Transliteration (69 Languages)

koRpus

sugiura, · カテゴリー: program · タグ:

https://reaktanz.de/?c=hacking&s=koRpus

michalke, m. (2017). koRpus: An R Package for Text Analysis (Version 0.11-1). Available from https://reaktanz.de/?c=hacking&s=koRpus

@Manual{,
title = {koRpus: An R Package for Text Analysis},
author = {m.eik michalke},
year = {2017},
note = {(Version 0.11-1)},
url = {https://reaktanz.de/?c=hacking&s=koRpus},
}

Multimedia Annotation

sugiura, · カテゴリー: program, 英語教育 · タグ:

http://sugiura-ken.org/wiki/wiki.cgi/exp?page=MultimediaAnnotation

英文を読む際に、語句の注釈を対訳で出すのと、音声を添えるのと、場合によっては画像で示す、というのを作ってみました。
音声は音声が出ることだけ確認できればということで合成音声で試作してあります。

あとは、注釈のついている語句を押すたびに、ログが取れるようにすれば、学習行動を分析できるようになります。

AuToBI

sugiura, · カテゴリー: program, Tech

http://eniac.cs.qc.cuny.edu/andrew/autobi/

AuToBI is a tool for the automatic analysis of Standard American English prosody. It is based largely on work described my dissertation — Automatic Detection and Classification of Prosodic Events.

ピッチアクセントとイントネーションによるフレーズ境界を特定し分類するとのこと。

すごいものを作りますねえ。

裏では、LIBLINEARという分類システムが動いていて、それは、SVMを使っているのかな。

これを動かすのは大変だわ。

OpenSesame と PyGaze

sugiura, · カテゴリー: bib, program, Tech, 研究 · タグ:

http://link.springer.com/article/10.3758%2Fs13428-011-0168-7

EyeLink用のプラグイン(PyGaze)もある。
http://link.springer.com/article/10.3758%2Fs13428-013-0422-2

R Programming Language Introduction and Resources

sugiura, · カテゴリー: program · タグ:

http://www.whoishostingthis.com/resources/r-programming/