NICE 2.3

■NICE 2.3(NICE2系 改訂版)を公開します。(2016-09-05)

NICE 2.2.2 が公開されていますが、異なる条件で収集された英文エッセイのファイルが混在しています。このうち、学習者データについて整理をし、改訂版として公開します。また、母語話者データも収集時期により二つに分けます。

・NICE 2系の学習者データは大きく分けて4種類のデータから構成されていました。
 1)当初の科研で収集した201ファイル
 2)その後、英語コーパス学会研究発表用に追加収集した8ファイル
 3)別の研究のために同一人物が二つのトピックを書くというタスクで収集した120ファイル
 4)また別の研究をするために別途収集した13ファイル

・これらの内、まず収集時に監督者が無かったものを除き
1)500語目安の指示が有ったものを「NICE Set 1」とし、
2)500語目安の指示が無かったものを「NICE Set 2」として整理しました。

また、Set 1については、同一著者による執筆が初回のもの(NICE Set 1A)と、2回目・3回目のもの(NICE Set 1B)とを分けました。同一著者が一つのトピックについてだけ執筆している場合は初回のもの(NICE Set 1A)となります。

●NICE Set 1: 当初の科研で収集した500語目安の指示が有ったデータのうち、
 NICE Set 1A: 同一著者による執筆が初回のもの(161ファイル)
 NICE Set 1B: 同一著者による執筆が2回目、3回目のもの( 29ファイル)

Set 2については、同一著者が二つのトピック(moneyとschool education)で執筆しているもの(NICE Set 2A)と、同一著者が一つのトピック(moneyかschool education)で執筆しているもの(NICE Set 2B)とに分けました。

●NICE Set 2: NICE 2.0で追加した500語目安の指示が無かったデータのうち、
 NICE Set 2A: 同一著者が二つのトピックで執筆しているもの(120ファイル)
 NICE Set 2B: 同一著者が一つのトピックで執筆しているもの(13ファイル)

・母語話者データについては、当初の科研で収集した200ファイルと、その後、別の研究のために収集した10ファイルの二つに分けます。それぞれのセット名を、NS1とNS2とします。

■プロフィール情報の不整合とその訂正について
・一人が2回以上書いたファイルについて、学習者のプロフィール情報の一覧表に関して不整合がありましたので、データ入力時のミスについては英文エッセイデータのヘッダー情報と照合し訂正し、それ以外については、別紙の通り、不整合の個所を明示したファイルを作成しましたので、ご参照ください。
・これらの不整合は、プロフィール情報が執筆協力者の自己申告によるものであり、記憶違いや書き間違い(忘れ)があったためと思われます。研究目的によってはこうしたデータの使用を差し控えるようにしてください。
★プロフィール情報に不整合な点があるという大名力氏の指摘により、この問題点に気が付きました。ご指摘に感謝いたします。なお、確認と訂正作業は独自に行いました。

■NICE2系の問題点について
上記のようにNICE2系のデータを整理しましたが、これによりNICE2系のデータの持っていた問題点のすべてが解決されたわけではありません。例えば、文章校正機能使用の有無については、こうした整理により改善されるものではありません。また、500語の目安の指示の有無が母語話者データでは大きな影響を与えていました。NICE2系の問題点についてはリンク先を参照し、NICE2系のデータを研究に使用される場合は、ご自身の研究の目的に照らし合わせてその使用をご判断ください。

■NICE 2.3 ダウンロード

ダウンロードに必要なユーザ名とパスワードは以下の通りです:

ユーザ名 Yes

パスワード 230

■NICE3について
NICE2系の問題点をクリアーすべく新たにデータを取り直したNICE3が公開されていますので、ご覧ください。
[3.3が公開されています]