Blog Sugiura

Enjoy

Gone with the Wind

sugiura, · カテゴリー: Phrase to remember

After all, tomorrow is another day.

Advanced R by Hadley Wickham

sugiura, · カテゴリー: program

http://adv-r.had.co.nz/

ロミオとジュリエット

sugiura, · カテゴリー: 未分類

http://mo-plays.com/rom-jul/

https://www.asahi.com/articles/ASLCP01KHLCNULZU01Q.html

喜劇に包まれた悲劇

舞台はVerona

seekR

sugiura, · カテゴリー: 未分類

http://seekr.jp/

言語情報処理ポータル

sugiura, · カテゴリー: 未分類

http://www.jaist.ac.jp/project/NLP_Portal/

GNU Aspell

sugiura, · カテゴリー: program

http://aspell.net/
 
なつかしい。
 

Google Dataset Search

sugiura, · カテゴリー: memo

https://toolbox.google.com/datasetsearch

研究成果の新しい切り口ですね。

「伝わるデザイン」

sugiura, · カテゴリー: Life Hack, memo

http://tsutawarudesign.com/
こういうサイトで勉強して、伝えるようにしてください。

“Science is the process of becoming less wrong,

sugiura, · カテゴリー: bib, 研究

and while hopefully the revisions are smaller and smaller after each step, there is no way of knowing that this is the case in advance.”
— Hartshorne et al. (2018: 274)

http://archive.gameswithwords.org/WhichEnglish/

@article{HARTSHORNE2018263,
title = “A critical period for second language acquisition: Evidence from 2/3 million English speakers”,
journal = “Cognition”,
volume = “177”,
pages = “263 – 277”,
year = “2018”,
issn = “0010-0277”,
doi = “https://doi.org/10.1016/j.cognition.2018.04.007”,
url = “http://www.sciencedirect.com/science/article/pii/S0010027718300994”,
author = “Joshua K. Hartshorne and Joshua B. Tenenbaum and Steven Pinker”
}

臨界期は、17.4歳

NLP TOOLS FOR THE SOCIAL SCIENCES

sugiura, · カテゴリー: software, Tech

https://www.linguisticanalysistools.org/

いろいろありますねぇ。

“* is an easy to use tool that *”

BUCLD 43

sugiura, · カテゴリー: News

http://www.bu.edu/bucld/
NOVEMBER 2–4, 2018
場所は言わずもがな。
 
なんか違うんですよね。Linguisticsと言語学。

GLMMが切り開く新たな統計の世界

sugiura, · カテゴリー: memo, Tech, 研究

第2回日本社会心理学会春の方法論セミナー
http://www.socialpsychology.jp/sympo/seminar_150325.html
本を読んで勉強するのもよいですが、
こうして、人から説明を聞くというのもとても勉強になりますね。
 
その時その場に参加できなくても、こうして話を聞けるというのは、とてもありがたいことです。

英語の縮約形一覧

sugiura, · カテゴリー: English, memo, Tech

https://github.com/dipanjanS/practical-machine-learning-with-python/blob/master/bonus%20content/nlp%20proven%20approach/contractions.py

InsPause

sugiura, · カテゴリー: software

https://vanya.jp.net/eng/inspause/
これはすごいソフトだ。
ポーズを自動的に入れてくれるだけでなく、調整もできる。

ロジスティック回帰での係数の数値の比較

sugiura, · カテゴリー: memo · タグ:

変数の分散が1になるように正規化してからロジスティック回帰をすれば、係数の数値の大きさでその変数の影響力を比べられるとのこと。(藤井 (2010) 『カテゴリカールデータ解析』共立出版. p. 93.)

Tidy Data

sugiura, · カテゴリー: 未分類 · タグ:

https://www.jstatsoft.org/article/view/v059i10

ID番号  事前  事後
1     40   50
2     60   65
3     55   79

というのはあつかいにくく、

ID番号  時点  得点
1     事前  40
2     事前  60
3     事前  55
1     事後  50
2     事後  65
3     事後  79

とする。

数学・統計用語集

sugiura, · カテゴリー: memo

http://www.qmss.jp/qmss/glossary/default.htm

こういうの、ありがたいですね。

The Prime Machine

sugiura, · カテゴリー: 未分類

http://www.theprimemachine.net

博論でこれを作ったということですね。

ブラウザーの環境変数

sugiura, · カテゴリー: 未分類

ブラウザーが何語を使うように設定してあるか、という「環境変数」を、ウェブサーバー側からその値を検知して、ブラウザーの設定言語にあわせて、ウェブページでの表示言語を日本語にするか英語にするか変える、ということができるのでした。
 
昨日、あるページが英語で表示されるようになってしまって、困ってしまいました。ブラウザー自体は日本語になっていて、日本語のページは日本語で見えていたのに、その特定のサイトだけ英語になってしまいました。
 
サイトに、英語と日本語の切り替えボタンのようなものはなく、どうしたものかと思っていたところ、ブラウザーの言語設定で英語が最優先になっているのが原因だとわかりました。二番目に日本語が設定してあったので、日本語「だけ」のページは日本語で、英語「だけ」のページは英語で表示されて、問題がなかったのでした。
 
ところが、その特定のサイトでは、ブラウザーで何語が設定してあるかを読み取って、最優先に指定してある言語でページを提示するという「高度なこと」を「ご親切にも」してくださっていたので、逆に、困ってしまったというわけです。
 
で、このブラウザーの環境変数というもの、JavaScriptやphpでウェブページにプログラムを埋め込んでおけば、ブラウザーでどの言語を指定してあるかだけでなく、どこからそのページにアクセスしてきたか、とか、OSは何で、ブラウザーは、何のどのバージョンを使っているか、というようなことが、「知られてしまう」わけです。
 
なるほどね、、、
 
たとえば、ここ ↓ 見てみてください。
https://www.iphiroba.jp/env.php
 
どれだけの情報が「知られてしまっているか」よくわかります。
 
もちろん、こうしたことは技術的には公開されていることで、ブラウザーが英語に設定してあったら、英語で表示するようにするという「親切な」使い方に応用することを想定して、こうした技術ができているわけですが、、、

Universal Dependencies

sugiura, · カテゴリー: memo, Tech

http://universaldependencies.org/

英語も日本語も

Webサーバー上でのディレクトリーの一覧

sugiura, · カテゴリー: memo, Tech · タグ:

原則、ディレクトリーでアドレスを指定したらファイル一覧の表示を禁止にしておく。
ファイル一覧を出したいディレクトリーでだけ、index.htmlを置かずに、.htaccess ファイルを置いておく。中に以下のように書いておく:
——————————
Options +Indexes
——————————

CentOSでnkf

sugiura, · カテゴリー: memo, Tech · タグ: ,

sudo yum install nkf

nkf -g ファイル名 で、ファイルの文字コードのguess


nkf -g index.html
EUC-JP (LF)

システムの文字コードを確認
echo $LANG
ja_JP.UTF-8

UTF-8に変換(上書きしてしまう)
nkf -w –overwrite index.html

『学術用語集 言語学編』

sugiura, · カテゴリー: bib, memo

とっても使いにくくなりました。
http://www.ls-japan.org/modules/news/details.php?bid=288
用語集の用語が全部「科学技術用語」に入れられてしまい、その全体からしか検索できない。
分野によって、定訳が違ったりするのだから、分野ごとに検索できるようにしないと使いづらい。
 
アマゾンで、冊子体を中古で買うのが一番かな。
https://www.amazon.co.jp/dp/4818195065/

動画の保存

sugiura, · カテゴリー: memo, software

画面上に表示される動画をキャプチャーして動画として保存する。

AG-デスクトップレコーダー
http://t-ishii.la.coocan.jp/download/AGDRec.html

自然言語処理における前処理の種類とその威力

sugiura, · カテゴリー: memo

https://qiita.com/Hironsan/items/2466fe0f344115aff177
図入りでわかりやすい。
 
便利なリンクもたくさん入っていて便利。
例えば
https://regex101.com/