Blog Sugiura

Enjoy

「3月27日から4月3日まで、フィラデルフィアで開催されるTESOL」

sugiura, · カテゴリー: 未分類

あ、そうですか。
たいていAAALと同じところで連続して行われるところが、今回は場所が違うんですね。
 

predictability 予測可能性

sugiura, · カテゴリー: bib, 研究 · タグ:

Frisson, Rayner, and Pickering (2005)

1) He mailed the letter without a _____.
2) He saw a beautiful _____.

Transitional ProbabilityはPredictabilityと独立しているか?

結論:TPはPredictabilityの一部(独立していない)。

The Oxford Handbook of Psycholinguistics

sugiura, · カテゴリー: bib · タグ:

アイトラッキング関連は、第6章と第18章と第19章。

(Section I Word recognition)
6 Eye movements and visual word recognition 89
Richard Shillcock
(語レベル)

(Section III Comprehension and discourse)
18 Spoken language comprehension: insights from eye movements 309
Michael K. Tanenhaus
(視覚世界パラダイム)

19 Eye movements and on-line comprehension processes 327
Adrian Staub and Keith Rayner
(文レベル、リーディンク)

本日の血圧

sugiura, · カテゴリー: 未分類

110/66

log

sugiura, · カテゴリー: 未分類

エクセルの関数は、デフォルトは、底が10。自然対数はlnとする。
Rは、自然対数。常用対数にするには、log10とする。
MIスコアなどでは、底を2とする。ゼロか1かのビットなので。
 
ややこしや。
 
 
えー、さらにややっこしいのが、エクセルでもVBAでは、logは自然対数で、常用対数にするには底の変換公式を使って変換しないといけない、つまり関数としてはない、のだそうだ。
 

正規性の検定

sugiura, · カテゴリー: 未分類

帰無仮説が「正規分布している」と設定される。
p値が5%未満(起きる確率)だったら、「正規分布している」を「なかったこと」(帰無)にする。
つまり、5%より小さかったら、正規分布しているとは言えない、ということになる。
 
この「考え方」が、よくある差の検定の場合と逆になっているので注意。

Ellis, Simpson-Vlach, and Maynard (2008)

sugiura, · カテゴリー: bib, 研究

Formulaic Language in Native and Second Language Speakers: Psycholinguistics, Corpus Linguistics, and TESOL.
TESOL Quarterly, Vol. 42, No. 3.
pp. 375-396.
 
コーパスから、3、4、5語表現で、100万語あたり10回以上の連語表現を抜き出し、
BarlowさんのCollocateで頻度とMIスコアを出した。
 
ジャンルが、アカデミックかどうかでLLで1%水準で頻度に差があるものを選び出した。
話し言葉で約2,000、書き言葉で約2,000。
 
そこから、話し言葉54、書き言葉54を、以下の枠組みで2表現ずつ層化ランダム抽出する。
1)3、4、5単語
2)頻度(低10.9、中15.0、高43.6)
3)MIスコア(低3.3、中6.7、高11)
 
3x3x3x2=54
 
で、合計108表現を実験項目に。
 
で、英語の先生方に、5段階で評価してもらう。
1)定型表現だと思うか
2)まとまった意味や機能があると思うか
3)教えた方がよいと思うか
 
で、相関が高いので、教えるに値する定型表現であると判断できる、と判断している。
 
実験1:フレーズ判断課題(反応時間)
反応時間を目的変数とした重回帰分析をして
母語話者は、MIが有意、頻度は有意ではない
学習者は、 MIは有意ではない、頻度が有意
 
実験2:読み上げ課題(Voice Onset Time)
同様に、
母語話者は、MIが有意、頻度は有意ではない
学習者は、 MIは有意ではない、頻度が有意
 
実験3:端末語判断課題(プライミング)
最後の単語の直前まで見せて(2秒)、1秒後に最後の単語を見せる。VOTをvoice keyで測定(使っているのはE-Prime)。
母語話者は、MIが有意、頻度は有意ではない
学習者は、 MIも頻度も有意ではない
 
で、まとめとしては、母語話者はMIに敏感で、学習者は頻度に敏感と結論付けている。
 
★疑問点
1)表現がlexical bundleであり、それに心理言語学的実在性があるというが、そうか?
2)重回帰分析のR^2が低すぎ
3)MIスコアをCollocateで出しているが、Collocateがどのような計算式でMIスコアを出しているか不明
 

 

@AAALinks

sugiura, · カテゴリー: 未分類

事前登録だけで1000人を超えてるのだそうだ。
#AAAL2012

Language Learning Lab

sugiura, · カテゴリー: 研究

http://web.me.com/ncellis/Language_Learning_Lab/Welcome.html
 
うーん、もともとは心理学か。
 
どっかで見た写真だなぁ。

5番目のフィールドにHとある場合のスコア(4番目フィールド)だけをベクトルに入れる

sugiura, · カテゴリー: 未分類 · タグ:

for (i in 1:nrow(MITP)){
if (MITP[i,5]==”H”){
TPH <- c(TPH, MITP[i,4])
}
}

空のベクトルを作る

sugiura, · カテゴリー: 未分類 · タグ:

TPH <- c()

TPH <- NULL

どちらでもよい。

data.01 <- read.csv("data.csv")

sugiura, · カテゴリー: 未分類 · タグ:

csvデータは、単に read.csv(“ファイル名”)で、見出しつきで読み込まれる。

Rに入れておくパッケージ

sugiura, · カテゴリー: 未分類 · タグ:

LanguageR
lme4
tm
corpora
zipfR
proxy
mvpart
tree
Design
 
何が入っているかは、

library()

で確認

The naive discriminative reader model

sugiura, · カテゴリー: bib, 研究

The activation of a meaning was obtained by summing the weights from the active letters and letter pairs to that meaning. Response latencies were modeled as inversely proportional to this activation, and log-transformed to remove for statistical analysis the skew from the resulting distribution of simulated reaction times.

http://www.ualberta.ca/~baayen/

形態素と単語の関係から、単語と連語の関係へと研究対象を広げている、、、
 
うーん、、、これは大変だ、、、
 

Review of Implicit and Explicit Knowledge in Second Language Learning, Testing and Teaching

sugiura, · カテゴリー: bib

http://linguistlist.org/pubs/reviews/get-review.cfm?SubID=4494515
こういうわかりやすいレビューがいいなぁ。

Formulaic sequences edited by Norbert Schmitt (2004)

sugiura, · カテゴリー: bib, English

Erman and Warren (2000)によれば、話し言葉の58.6%、書き言葉の52.3%を占めている。
Foster (2001)によれば、話し言葉の32.3%。
 
その定義については、
Wray and Perkins (2000)やWray (2002) が詳しいと言っておきながら、中の論文では、イディオムだけを対象にしていたりするんだから、、、
 

Daylight Saving Time

sugiura, · カテゴリー: memo

朝起きて日記を書こうと思ったら、去年の今日に「今日からDaylight Saving Time」とある。え、もう?と思ったら、なんと今年は3月11日からだった。
日本の朝5時30分は、ボストンでは前日夕方4時30分ってことになる。
日本は昨日は雪(25年ぶりの3月)。「夏時間」とは呼べないわ。

Extending the Linear Model with R

sugiura, · カテゴリー: 未分類 · タグ:

http://www.maths.bath.ac.uk/~jjf23/ELM/

lmerで使う記号

sugiura, · カテゴリー: 未分類 · タグ: , ,

+ で要因を追加する
| でエラー条件を指定
: で交互作用を指定
* でそれぞれの要因だけでなく交互作用も含める(例:X*YというのはX+Y+X:Yと同じ)

2011年度「学習者コーパス論」でR

sugiura, · カテゴリー: 大学院授業 · タグ: ,

講義ノート改訂版公開。
http://sugiura-ken.org/wiki/wiki.cgi/exp?page=R

シュールな風景

sugiura, · カテゴリー: 未分類

研究室を片付けようと思うのだけれど、小テストとか、取扱い注意の書類とか、簡単に捨てられない紙類がたくさんあって、片付かない。一部は、シュレッダーに書けるのだけれど、かさばる。ウインウインいいながらシュレッダーにかけて、山のような紙きれを大きなビニール袋にいれていく、、、
 
なんとその非生産的なこと。

lmer()

sugiura, · カテゴリー: 未分類 · タグ: , ,

lmer(RT ~ Trial + (1|Subject) + (1|Word), data)
 
反応時間(RT)に試行(Trial)が影響を与えるか、という問題ととらえる。
 
このTrialが固定要因
後ろのSubjectとWordが変量要因
最後のdataが分析対象のデータセット
 
Baayen (2008)では、このデータセットが、lexdecというもので、
語彙判断課題の反応時間のデータ。
被験者21人
刺激語79個(動物44個、植物35個)
 
反復測定。
各項目に対し21人分のデータを繰り返し取っている。
各被験者から79個分のデータを繰り返し取っている。
 
(1|Subject)と書いてあるのは、「1」は切片を表す1。
線形モデルでは、切片が、ベースラインとなる平均を表す。

固定要因と変量要因

sugiura, · カテゴリー: 未分類 · タグ:

Y=固定要因+変量要因+誤差
固定要因は、要因が決まっているもの。頻度が高いか低いか。
変量要因は、ばらつきが含まれる要因。個人差のある被験者とかばらつきのある実験項目。
 
ということは、変量要因として被験者と実験項目があるばあいは、次のような式になる:
Y=固定要因+変量要因1+変量要因2+誤差
 
もし要因が二つとなると
Y=固定要因1+固定要因2+変量要因1+変量要因2+誤差
となる。
(さらには、それぞれの要因間の交互作用も、、、)
 

ペースを保って学習してもらいたい。

sugiura, · カテゴリー: 英語の授業

課外学習の課題をだして、学期中に終わらせること、と指示すると、かなりの割合で学期末に駆け込みで終わらせる学生がいる。コツコツ分散学習をすることが語学の場合重要なのに、これでは単に「終わらせる」ことだけが目標になって、よくない。
 
では、どうするか。
 
分散学習が重要なんですよ、と言ってなるほどと思ってくれるような学生は、そもそも、まじめで最初からコツコツやっている。コツコツやらずに、締切ギリギリにためておいて終わらせるような学生に、いかに分散して学習させるか、が問題。
 
締切を小刻みにするというのも手。もう一つの手は、コツコツ学習したことが数字に表れて、それが得点つまり成績に反映されるようにすれば良い。
 
コツコツペースを保って学習するということは、一定のペースで学習すること。つまりペースに変動がないということ。であれば、変動係数を使って、変動が0の場合に一番よい成績がとれるようにすれば良い。
 
変動係数は、標準偏差を平均でわったもの。変動がなければ0。変動が大きくなるとだんだん大きくなって、最大約1.732になる。
 
となると、

得点=素点×(1−(変動係数÷1.732))

これで期間をきめて、その期間にいくつすること、と指示をしておけば、コツコツやることになるでしょう。
そもそも、素点が低い人は、それなりに低くなりますし。

一般線形モデルの前提

sugiura, · カテゴリー: 未分類 · タグ: ,

独立性:一人から2回データを取って、それを「別人の」二人分のデータ扱いをしてはいけない。
 
分散の均一性
誤差の正規性
線形性
 
正規分布になってないデータは、変換する。
 平方根変換(ポアソン分布もこれで対応可)
 逆数変換
 対数変換
(逆正弦変換)