Blog Sugiura

Enjoy

XNote

sugiura, · カテゴリー: 未分類 · タグ:

https://addons.thunderbird.net/ja/thunderbird/addon/xnotepp/

メールに付箋をつけるというThunderbirdのアドオン

RStudio Cheat Sheets

sugiura, · カテゴリー: memo, Tech, 未分類
こういうのがあるとベンリですよね。

ロミオとジュリエット

sugiura, · カテゴリー: 未分類

http://mo-plays.com/rom-jul/

https://www.asahi.com/articles/ASLCP01KHLCNULZU01Q.html

喜劇に包まれた悲劇

舞台はVerona

seekR

sugiura, · カテゴリー: 未分類

http://seekr.jp/

言語情報処理ポータル

sugiura, · カテゴリー: 未分類

http://www.jaist.ac.jp/project/NLP_Portal/

Tidy Data

sugiura, · カテゴリー: 未分類 · タグ:

https://www.jstatsoft.org/article/view/v059i10

ID番号  事前  事後
1     40   50
2     60   65
3     55   79

というのはあつかいにくく、

ID番号  時点  得点
1     事前  40
2     事前  60
3     事前  55
1     事後  50
2     事後  65
3     事後  79

とする。

The Prime Machine

sugiura, · カテゴリー: 未分類

http://www.theprimemachine.net

博論でこれを作ったということですね。

ブラウザーの環境変数

sugiura, · カテゴリー: 未分類

ブラウザーが何語を使うように設定してあるか、という「環境変数」を、ウェブサーバー側からその値を検知して、ブラウザーの設定言語にあわせて、ウェブページでの表示言語を日本語にするか英語にするか変える、ということができるのでした。
 
昨日、あるページが英語で表示されるようになってしまって、困ってしまいました。ブラウザー自体は日本語になっていて、日本語のページは日本語で見えていたのに、その特定のサイトだけ英語になってしまいました。
 
サイトに、英語と日本語の切り替えボタンのようなものはなく、どうしたものかと思っていたところ、ブラウザーの言語設定で英語が最優先になっているのが原因だとわかりました。二番目に日本語が設定してあったので、日本語「だけ」のページは日本語で、英語「だけ」のページは英語で表示されて、問題がなかったのでした。
 
ところが、その特定のサイトでは、ブラウザーで何語が設定してあるかを読み取って、最優先に指定してある言語でページを提示するという「高度なこと」を「ご親切にも」してくださっていたので、逆に、困ってしまったというわけです。
 
で、このブラウザーの環境変数というもの、JavaScriptやphpでウェブページにプログラムを埋め込んでおけば、ブラウザーでどの言語を指定してあるかだけでなく、どこからそのページにアクセスしてきたか、とか、OSは何で、ブラウザーは、何のどのバージョンを使っているか、というようなことが、「知られてしまう」わけです。
 
なるほどね、、、
 
たとえば、ここ ↓ 見てみてください。
https://www.iphiroba.jp/env.php
 
どれだけの情報が「知られてしまっているか」よくわかります。
 
もちろん、こうしたことは技術的には公開されていることで、ブラウザーが英語に設定してあったら、英語で表示するようにするという「親切な」使い方に応用することを想定して、こうした技術ができているわけですが、、、

3通りのDOI

sugiura, · カテゴリー: 未分類

http://blog.apastyle.org/apastyle/2017/03/doi-display-guidelines-update-march-2017.html

https://doi.org/10.1037/arc0000014
http://dx.doi.org/10.1037/arc0000014
doi:10.1037/arc0000014

一番上が、今後使われていく形式。
でも、3通りがこれまで使われてきている。
さしあたっては、どの形式でもよいけれど、どれかに統一して使うこと、ってことです。

AudacityはWindows Media Audioファイル、ダメ

sugiura, · カテゴリー: 未分類

特許上の制限によりこの形式のファイルを開くことはできません、とのこと。

UbuntuでLibreOfficeをバージョンアップ

sugiura, · カテゴリー: 未分類

sudo add-apt-repository ppa:libreoffice/ppa
とすると、「安定版」ではなくて「最新版」がインストールされる

「安定版」を入れたい場合は、バージョンを指定する必要がある。
sudo add-apt-repository ppa:libreoffice/libreoffice-5-4

それをやってから、
sudo apt-get update

で、
sudo apt-get upgrade
もしくは
sudo apt-get dist-upgrade

自己の相対化

sugiura, · カテゴリー: 未分類

4月9日に教養教育院のFDがあり、東京大学の駒場の藤垣先生が講演された。題目は「教養教育とは何か」
 
それがすなわち「自己を相対化する力」であるという定義。

これで、なぜ外国語を学ぶのか、も、なぜ古典を学ぶのか、も説明できます。
 
すばらしいですね、この定義。教養をこんな風に考えてみたことなかったです。
 
逆は、自己の絶対視・絶対化ですね。
 
そういえば、絶対視せずに相対化するという発想自体を相対化する、どんどんと相対化するということを考えていたら、絶対化されることから逃げ続けるということになるなと思って、「逃走論」を思い出しました。浅田彰、スキゾ・キッズです。スキゾの逆がパラノですね。

quanteda

sugiura, · カテゴリー: program, 未分類 · タグ:

https://quanteda.io/

使用例

> kwic(body.tmp, “is”)

[text8, 7] you play BUDO, there | is | an important thing that you
[text9, 2] It | is | " REI".
[text10, 6] First," REI" | is | the feeling that you thank
[text14, 2] This | is | the expression that players thank
[text15, 6] Secondly," REI" | is | the felling that you thank
[text18, 6] Finally," REI" | is | the feeling that you thank
[text27, 2] This | is | the same good point which

Package ‘NLP’

sugiura, · カテゴリー: 未分類 · タグ: ,

https://cran.r-project.org/web/packages/NLP/

NLTK 3.2.5 documentation

sugiura, · カテゴリー: 未分類

http://www.nltk.org/

これは、Python 3 用

numpy-1.11.2.zip

python setup.py install
VC必要

nltk-3.2.5.win32.exe

UnicodeとWindows-1252(西洋言語文字コード)

sugiura, · カテゴリー: 未分類

引用符(シングル、ダブル)、アポストロフィー、ダッシュ(em, en)などで、文字化けの原因となる。
 
このようなことです。
https://www.justinweiss.com/articles/how-to-get-from-theyre-to-theyre/
 

Microsoft R Open

sugiura, · カテゴリー: 未分類 · タグ:

https://mran.microsoft.com/open/

Revolution R OpenをMicrosoftが買収して、
Microsoft R Open という名前にしてた。
 
お金で何でも買っちゃうところが、、、

Stanford CoreNLP

sugiura, · カテゴリー: 未分類

http://nlp.stanford.edu:8080/corenlp/process

文を入れると、統語解析して、構造を図で示してくれる。

Excelとnbsp

sugiura, · カテゴリー: 未分類

ややこしや

https://techracho.bpsinc.jp/baba/2010_07_22/2178

http://kokoore.com/space-nbsp

https://ja.wikipedia.org/wiki/%E3%83%8E%E3%83%BC%E3%83%96%E3%83%AC%E3%83%BC%E3%82%AF%E3%82%B9%E3%83%9A%E3%83%BC%E3%82%B9

Excelでの文字化け

sugiura, · カテゴリー: 未分類 · タグ:

http://primarytext.jp/blog/1275

csvで保存されたUTF-8のテキストファイルをExcelで開くと、SJISとして開いてしまって文字化けが起きる。

テキストファイルをSJISで保存し直してからExcelで開けばよいわけだけれど、上記サイトによれば、BOMをつけるだけで、ExcelはUTF-8とみなしてくれるとのこと。ふーん、、、

Internet Explorer 11

sugiura, · カテゴリー: 未分類 · タグ:

1)タブの横で右クリックして、「メニューバー」と「ステータスバー」を表示する。
2)「ツール」の「互換表示設定」を選ぶとNUCTでファイルをダウンロードするときの文字化けが直る。

ZoomIt

sugiura, · カテゴリー: 未分類

https://technet.microsoft.com/ja-jp/sysinternals/zoomit.aspx

Ctrl+1は、Thunderbirdの受信トレイの展開とかぶるので、Ctrl+0に変更

BAAL 2017

sugiura, · カテゴリー: 未分類

http://www.baal2017.org.uk/
なんと、EuroSLA 2017と完全にバッティング。31st August – 2nd September, 2017
それも、両方ともイギリス。
ほんと?

Text Analysis Online

sugiura, · カテゴリー: 未分類

http://textanalysisonline.com/

Link Grammar

sugiura, · カテゴリー: 未分類

http://www.link.cs.cmu.edu/link/