Blog Sugiura

Enjoy

The Prime Machine

sugiura, · カテゴリー: 未分類

http://www.theprimemachine.net

博論でこれを作ったということですね。

ブラウザーの環境変数

sugiura, · カテゴリー: 未分類

ブラウザーが何語を使うように設定してあるか、という「環境変数」を、ウェブサーバー側からその値を検知して、ブラウザーの設定言語にあわせて、ウェブページでの表示言語を日本語にするか英語にするか変える、ということができるのでした。
 
昨日、あるページが英語で表示されるようになってしまって、困ってしまいました。ブラウザー自体は日本語になっていて、日本語のページは日本語で見えていたのに、その特定のサイトだけ英語になってしまいました。
 
サイトに、英語と日本語の切り替えボタンのようなものはなく、どうしたものかと思っていたところ、ブラウザーの言語設定で英語が最優先になっているのが原因だとわかりました。二番目に日本語が設定してあったので、日本語「だけ」のページは日本語で、英語「だけ」のページは英語で表示されて、問題がなかったのでした。
 
ところが、その特定のサイトでは、ブラウザーで何語が設定してあるかを読み取って、最優先に指定してある言語でページを提示するという「高度なこと」を「ご親切にも」してくださっていたので、逆に、困ってしまったというわけです。
 
で、このブラウザーの環境変数というもの、JavaScriptやphpでウェブページにプログラムを埋め込んでおけば、ブラウザーでどの言語を指定してあるかだけでなく、どこからそのページにアクセスしてきたか、とか、OSは何で、ブラウザーは、何のどのバージョンを使っているか、というようなことが、「知られてしまう」わけです。
 
なるほどね、、、
 
たとえば、ここ ↓ 見てみてください。
https://www.iphiroba.jp/env.php
 
どれだけの情報が「知られてしまっているか」よくわかります。
 
もちろん、こうしたことは技術的には公開されていることで、ブラウザーが英語に設定してあったら、英語で表示するようにするという「親切な」使い方に応用することを想定して、こうした技術ができているわけですが、、、

3通りのDOI

sugiura, · カテゴリー: 未分類

http://blog.apastyle.org/apastyle/2017/03/doi-display-guidelines-update-march-2017.html

https://doi.org/10.1037/arc0000014
http://dx.doi.org/10.1037/arc0000014
doi:10.1037/arc0000014

一番上が、今後使われていく形式。
でも、3通りがこれまで使われてきている。
さしあたっては、どの形式でもよいけれど、どれかに統一して使うこと、ってことです。

AudacityはWindows Media Audioファイル、ダメ

sugiura, · カテゴリー: 未分類

特許上の制限によりこの形式のファイルを開くことはできません、とのこと。

UbuntuでLibreOfficeをバージョンアップ

sugiura, · カテゴリー: 未分類

sudo add-apt-repository ppa:libreoffice/ppa
とすると、「安定版」ではなくて「最新版」がインストールされる

「安定版」を入れたい場合は、バージョンを指定する必要がある。
sudo add-apt-repository ppa:libreoffice/libreoffice-5-4

それをやってから、
sudo apt-get update

で、
sudo apt-get upgrade
もしくは
sudo apt-get dist-upgrade

自己の相対化

sugiura, · カテゴリー: 未分類

4月9日に教養教育院のFDがあり、東京大学の駒場の藤垣先生が講演された。題目は「教養教育とは何か」
 
それがすなわち「自己を相対化する力」であるという定義。

これで、なぜ外国語を学ぶのか、も、なぜ古典を学ぶのか、も説明できます。
 
すばらしいですね、この定義。教養をこんな風に考えてみたことなかったです。
 
逆は、自己の絶対視・絶対化ですね。
 
そういえば、絶対視せずに相対化するという発想自体を相対化する、どんどんと相対化するということを考えていたら、絶対化されることから逃げ続けるということになるなと思って、「逃走論」を思い出しました。浅田彰、スキゾ・キッズです。スキゾの逆がパラノですね。

quanteda

sugiura, · カテゴリー: program, 未分類 · タグ:

https://quanteda.io/

使用例

> kwic(body.tmp, “is”)

[text8, 7] you play BUDO, there | is | an important thing that you
[text9, 2] It | is | " REI".
[text10, 6] First," REI" | is | the feeling that you thank
[text14, 2] This | is | the expression that players thank
[text15, 6] Secondly," REI" | is | the felling that you thank
[text18, 6] Finally," REI" | is | the feeling that you thank
[text27, 2] This | is | the same good point which

Package ‘NLP’

sugiura, · カテゴリー: 未分類 · タグ: ,

https://cran.r-project.org/web/packages/NLP/

NLTK 3.2.5 documentation

sugiura, · カテゴリー: 未分類

http://www.nltk.org/

これは、Python 3 用

numpy-1.11.2.zip

python setup.py install
VC必要

nltk-3.2.5.win32.exe

UnicodeとWindows-1252(西洋言語文字コード)

sugiura, · カテゴリー: 未分類

引用符(シングル、ダブル)、アポストロフィー、ダッシュ(em, en)などで、文字化けの原因となる。
 
このようなことです。
https://www.justinweiss.com/articles/how-to-get-from-theyre-to-theyre/