Blog Sugiura

Enjoy

2012 AAAL Conference

sugiura, · カテゴリー: 未分類

March 24-27, 2012

Sheraton Boston
39 Dalton Street
Boston, Massachusetts 02199

http://aaal.org/displaycommon.cfm?an=1&subarticlenbr=61

寒そうだなぁ、、、

本のスキャン

sugiura, · カテゴリー: 未分類

スーバーファイン
グレー
白紙を削除しないように
文字の傾きは補正
書類の向きを自動で判断しないように
 
あとからOCRをかける

めやす、500ページ30分。

★ちょっとしたコツ
ときどき、ノリがページ間にはみ出ていて、複数のページがくっついていることがある。
そうなるとジャムしてしまう。
60ページ単位でまとめて処理して、30枚に分かれているか、お札を数えるようにして、パラパラと数えてからセットすること。

本の背表紙をカットしてもらうことを英語では「Cut off spines of books」という。一冊1ドル49セント

Cameron-Faulkner, Lieven, & Tomasello (2003)

sugiura, · カテゴリー: 未分類 · タグ:

A construction based analysis of child directed speech
Cognitive Science 27 (2003) 843–873.

英語母語の子供は、毎日7000発話を聞いている。
そのうち2000は質問、1500は不完全文、1000はbe動詞を使った単文、400が複雑な発話。
 
個別表現としては、
360が、What isかAre youの質問、
その半分くらいが、Who’sかCan youの質問、
200から300がThat’sかIt’sの構文、
50から60が、I thinkかIfの文。
 
これらはあくまでも「平均像」。

英語で典型的と思われている他動詞構文は、意外と少ない。
3歳になるまで、語順だけでは何が主語で何が目的語かを判断できない。
 
耳にする発話の30%に主語がない。40%は主語は助動詞や動詞の後にある。15%が動詞の後ろに目的語が来る。

つまり、SVOのパタンの発話は実際はあまり耳にしない。

母親は、命令文や疑問文や不完全文で使う表現も多いので、そういう表現は子供も主語なしで使うようになる。

Thompson & Hopper (2001)では、大人同士の会話で、主語と目的語のある節は25%しかなかった。

不完全文として発話されるものの98%は、名詞句、動詞句、前置詞句、副詞句などの句。
 
一語発話は、動詞より名詞が6倍多い。
句単位の発話は、動詞句より名詞句が2倍多い。

あとは、タイプ頻度の重要性。

データの性質

sugiura, · カテゴリー: 未分類

分析しようとしているデータがどのような性質をもったものか。
その性質を踏まえた分析をしないといけない。
 
性質というのは、どのような変化をするデータなのか、ということ。
 
連続的に変化するもの(重さとか、時間とか)か、非連続的(賛成か反対か)か。
 
非連続のものでも、順序が関係する(かけっこの順位)か、しない(男女)か。

順序が関係しても、その順位間の値の差は等間隔か。
 
連続的に変化するものでも、変化は直線的かどうか。
 
 
観察対象そのものの持つ性質と、それを分析するときにどのような性質のものとして扱うかという違いもあるので注意が必要。 
 
たとえば、「学力」は、性質としては、連続的だと考えられる。が、テストなどで測定すると、得点として表現される。その得点の付け方にもよるが、まあ、連続的なデータを等間隔で繁栄した得点だと想定すれば、連続的なデータであると言えるでしょう。
 
テストの点に基づいて、順位を付けるとなると、その順位は、非連続で、順番がありますが、順番の数字自体がデータの性質を「等間隔」で表しているとは限らないので(ダントツ一位とか)注意が必要ですね。
 
それとか、テストの点に基づいて、500点以上を上級、それ未満を中級と振り分けたら、その上級と中級というのは、非連続になりますね。「上級学習者」と「中級学習者」を比べたら、、、といった場合、「上級」と「中級」の差は、扱い上は非連続ですが、その「級」がしめしているはずの「学力」は、そもそも連続的なもののはずですね。
 

Pythonでインタラクティブに入力するとき

sugiura, · カテゴリー: program · タグ:

そのまま、inputすると、数字だと思うので、文字だということを示すにはダブルクオートでくくる必要がある。
が、それは面倒だし、ディレクトリーの区切りの / やら やらをどーするの(エスケープする?)ということがあるので、raw_inputにすれば、文字通りそのまま入力できる。

try:
SUU = int(raw_input("How many? "))

try:
KOTAE = str(raw_input("y or n: "))

Windowsでファイルの比較 fc

sugiura, · カテゴリー: Tech · タグ:

diffなんですけど、Windowsのコマンドプロンプト使ってる時、どーします?
 
ありました。 fc って、file compare かなぁ。

こちら参照のこと:
http://www.jp.redhat.com/manual/Doc9/rhl-gsg-ja-9/ch-doslinux.html

Pythonで今いるところのディレクトリーを得るには

sugiura, · カテゴリー: 未分類 · タグ: ,

EyeTrackでとってEDFファイルで保存して、
Visual EDF2ASCで、ASCファイルに変換して
EyeDoctorでimportして、データを編集して、exportで、EyeDry用DA1ファイルとして保存。
そこからは、UMDのPythonスクリプトで処理して、Rで分析できるようにする。
 
DA1ファイルがどこにあるかをインタラクティブに入力しなければならない仕様になっていたが、その処理をするスクリプトorganizeDA1.pyと処理対象のDA1ファイルは同じディレクトリーに入れるので、いちいちフルパスを手で入れるのは、面倒だし、ディレクトリーの区切りを示す記号が、OSによって違っていたり、Windowsではドライブ名も入れるのか、というような面倒な問題がある。
ので、以下のように修正:

"""
try:
DATAFOLDER = str(raw_input("Complete directory address with DA1 files:"))
except NameError:
print('Error: must be a string')
exit()
except ValueError:
print('Error: must be a string')
exit()
"""

# Get the complete directory address, where this script is. (2011-08-12 Masa Sugiura)
from os import path
DATAFOLDER = path.dirname(path.abspath(__file__))
#

Pythonで複数行のコメントアウト

sugiura, · カテゴリー: 未分類 · タグ:

ダブルクオート三つで囲むのだそうだ。
http://tech.bayashi.jp/archives/entry/techweb/2007/001798.html

こんな風:(WordPressが勝手に引用符のフォントを変えるので注意。あ、codeと指定すれば大丈夫か、、、)

"""
try:
DATAFOLDER = str(raw_input("Complete directory address with DA1 files:"))
except NameError:
print('Error: must be a string')
exit()
except ValueError:
print('Error: must be a string')
exit()
"""

compensation $10

sugiura, · カテゴリー: 未分類

実験協力の「謝金」。
ま、だいたいこのくらい。か、$15。内容と時間による。

procrastination

sugiura, · カテゴリー: Life Hack

やればいいのに、なかなか仕事をしないこと。
ぐずぐず先延ばしにすること。
先延ばしにしても、解決しない。
 
反対は、productive。
結果を出すこと。
結果を出さなかったら何も残らない。
 
R. P. が言っていた。「ボスが欲しいのは結果だ。言い訳ではない。」