TETDM(テトディーエム): テキストデータマイニングのための統合環境

投稿日: 2012-01-13 投稿者: sugiuraコメントを受け付けていません

http://www.sys.info.hiroshima-cu.ac.jp/people/sunayama/future/newfuture.html うーん、壮大な試みだ。

R クリップボードからのデータの読み込み

投稿日: 2011-09-10 投稿者: sugiuraコメントする

1）Windows data <- read.table(“clipboard”) 2）Mac data <- read.table(stdin())　ここでreturn そしてペース…

Pythonでインタラクティブに入力するとき

投稿日: 2011-08-13 投稿者: sugiuraコメントする

そのまま、inputすると、数字だと思うので、文字だということを示すにはダブルクオートでくくる必要がある。が、それは面倒だし、ディレクトリーの区切りの / やらやらをどーするの（エスケープする？）ということがあるので…

JavaScript Timer

投稿日: 2011-06-04 投稿者: sugiuraコメントする

http://www.sykronix.com/researching/browser/loop/ ↑ ここにわかりやすい説明がある。 JavaScriptのプログラムは、OS の tick に基づいて、時間を刻んでいる…

common.py

投稿日: 2011-05-09 投稿者: sugiuraコメントする

練習がてら、ちょこっとやったらできた。 http://sugiura-ken.org/wiki/wiki.cgi/exp?page=common%2Epy 一行一単語になっている二つのファイルから、共通するものを選び出す…

インスタント・パイソン

投稿日: 2011-05-06 投稿者: sugiuraコメントする

http://www.python.jp/Zope/intro/instant_python_jp ま、これ見とけばいいかな。

Python

投稿日: 2011-01-19 投稿者: sugiuraコメントする

http://www.python.org/ 日本Pythonユーザ会（PyJUG） http://www.python.jp/Zope Python チュートリアル http://www.python.jp/doc/2…

NLTK on Mac

投稿日: 2011-01-17 投稿者: sugiuraコメントする

http://www.nltk.org/download ダウンロードして、インストールする仕方が書いてある。　 MacOS上のPythonのバージョンを調べる。 macbookair:~ sugiura$ pytho…

ふりがな翻訳（通称ルビ訳）

投稿日: 2010-02-27 投稿者: sugiuraコメントする

http://rubiyaku.com/ これは面白い。　こちらを参考にしている模様： http://d.hatena.ne.jp/shunsuk/20080218/1203340110 　 1. カンマやセミコロン…

表計算ソフトで平均を出すときの注意

投稿日: 2010-02-15 投稿者: sugiura2件のコメント

授業の小テストの平均を出す例。 =AVERAGE(E2:P2) とやってしまうと、欠席した日の得点を空欄にしたままだと、欠席した日（つまり欠損値）は除いて平均を出してしまう。これだと、欠席が多くても出席した日に高得点を取…

Quantitative Methods in Linguistics

投稿日: 2009-12-21 投稿者: sugiuraコメントする

Keith Johnson Wiley-Blackwell (2008/3/21) いやー、これ、すごいわ。「リサーチデザインと言語統計処理」のテキストに理想的には最適だと思う。しかし、このままは使えんだろうな。し…

Quantitative Corpus Linguistics With R: A Practical Introduction

投稿日: 2009-10-06 投稿者: sugiuraコメントする

http://www.amazon.co.jp/dp/0415962706/ 著者 Stefan Th. Gries おお、この人だったんだ。なになに、、、うーん、Rで統計処理だけじゃなく、テキスト処理もしてしまうんだ。…

コメントを書くこと

投稿日: 2009-07-27 投稿者: sugiuraコメントする

人のプログラム（スクリプト・ソースコード）を使わせてもらうのは、悪いことではないけれど、なぜそのプログラムがそのような動き・働きをするのか、ということは理解した上で、使った方がよい。特に、プログラミングを学ぶ立場にある場…

特定の「正規表現」だけを検索しリストを作成するPerl一行スクリプト

投稿日: 2009-07-26 投稿者: sugiuraコメントする

perl -ne ‘print $&.”n” if(/正規表現/)’ ファイル名 perl -ne ‘print $&.”n” if(/ww+/)’ enamdict > name.list これで…

日本語の「名前」のリスト

投稿日: 2009-07-26 投稿者: sugiuraコメントする

ENAMDICT/JMnedict http://www.csse.monash.edu.au/~jwb/enamdict_doc.html http://ftp.monash.edu.au/pub/nihongo/en…

二つのファイルを比べて、片方にだけある単語を見つける

投稿日: 2009-07-24 投稿者: sugiura3件のコメント

http://oscar.gsid.nagoya-u.ac.jp/program/perl/compB.txt

Perl １行コマンド（３行目から８行目だけ表示）

投稿日: 2009-07-24 投稿者: sugiuraコメントする

perl -ne ‘print if 3 .. 8’ file.txt

テキストファイル内の単語をバラバラにしてリストを作る

投稿日: 2009-07-23 投稿者: sugiuraコメントする

#!/usr/bin/perl # copyleft 2009-07-23 sugiura@nagoya-u.jp # chklist.pl で、ファイル while(<>){ chomp; …

Blog Sugiura

Enjoy! 杉浦正利

program