Ellis, Simpson-Vlach, and Maynard (2008)

Formulaic Language in Native and Second Language Speakers: Psycholinguistics, Corpus Linguistics, and TESOL.
TESOL Quarterly, Vol. 42, No. 3.
pp. 375-396.
 
コーパスから、3、4、5語表現で、100万語あたり10回以上の連語表現を抜き出し、
BarlowさんのCollocateで頻度とMIスコアを出した。
 
ジャンルが、アカデミックかどうかでLLで1%水準で頻度に差があるものを選び出した。
話し言葉で約2,000、書き言葉で約2,000。
 
そこから、話し言葉54、書き言葉54を、以下の枠組みで2表現ずつ層化ランダム抽出する。
1)3、4、5単語
2)頻度(低10.9、中15.0、高43.6)
3)MIスコア(低3.3、中6.7、高11)
 
3x3x3x2=54
 
で、合計108表現を実験項目に。
 
で、英語の先生方に、5段階で評価してもらう。
1)定型表現だと思うか
2)まとまった意味や機能があると思うか
3)教えた方がよいと思うか
 
で、相関が高いので、教えるに値する定型表現であると判断できる、と判断している。
 
実験1:フレーズ判断課題(反応時間)
反応時間を目的変数とした重回帰分析をして
母語話者は、MIが有意、頻度は有意ではない
学習者は、 MIは有意ではない、頻度が有意
 
実験2:読み上げ課題(Voice Onset Time)
同様に、
母語話者は、MIが有意、頻度は有意ではない
学習者は、 MIは有意ではない、頻度が有意
 
実験3:端末語判断課題(プライミング)
最後の単語の直前まで見せて(2秒)、1秒後に最後の単語を見せる。VOTをvoice keyで測定(使っているのはE-Prime)。
母語話者は、MIが有意、頻度は有意ではない
学習者は、 MIも頻度も有意ではない
 
で、まとめとしては、母語話者はMIに敏感で、学習者は頻度に敏感と結論付けている。
 
★疑問点
1)表現がlexical bundleであり、それに心理言語学的実在性があるというが、そうか?
2)重回帰分析のR^2が低すぎ
3)MIスコアをCollocateで出しているが、Collocateがどのような計算式でMIスコアを出しているか不明