CLAN
NICER

!!!CLANでNICERを処理する
{{outline}}
----
!!CHATに基づくNICERのフォーマット

!共通点
*ファイルは@Beginで始まり@Endで終わる。
*「ヘッダー情報」は、ファイルの先頭部分で、行頭に@項目名で示す
*「本文部分」は、行頭にアスタリスク＋話者記号で、一発話一行で記述
*各発話の関連情報は、発話の下（次の発話との間）に、行頭に%項目名で示す
*行の先頭の項目名と内容との間は、コロンとタブで区切る


!CHATフォーマット
minCHATという最低限の枠
{{pre
@Begin
@Languages:	eng
@Participants:	CHI
@ID:	
*CHI:	
@End
}}


!NICERのフォーマット
*ヘッダー情報の注意点
** @Qualification で英語力を示す試験のスコア情報
** @Abroad で海外滞在経験
** @Topic でエッセイのトピック
** @Criterion で、そのエッセイをCriterionにかけた時の評価スコア（6点満点）
{{pre
@Begin
@Participants:	JPN501
@PID:	PIDJP501
@Age:	21
@Sex:	F
@YearInSchool:	U2
@Major:	agriculture
@StudyHistory:	8
@OtherLanguage:	Chinese=1.0;none=
@Qualification:	TOEIC=590(2013);none=;none=
@Abroad:	none=;none=
（中略）
@Topic:	sports
@Criterion:	4
（中略）
*JPN501:	What kind of sports do you like?
%NTV:	OK
%COM:	
（本文以下省略）
@End
}}
*本文部分
** *JPN501 は話者記号
** %NTV は英語母語の添削者による訂正（書き換え）文
** %COM は添削時のコメント

*この3行がセットとなって、発話の数だけ含まれる

*実例: JPN501.txt


!!CLANの準備
!インストール
!workingディレクトリーの設定
*CLAN起動後、コマンド・ウィンドウ内の一番上「working」で設定
**分析対象とするファイルを入れたフォルダーを指定
***あらかじめ、分析対象とするファイルを選んでおくのがコツ
{{ref_image commandwindow.jpg}}
!!CLANの実行
!コマンド・ウィンドウ
*Progs
**コマンドを選ぶ（例：検索 kwal）
**コマンドボックス内に選んだコマンドが表示される
**選んだコマンドに応じて、ボタンが表示される（例：「File In」「Tiers」「Search」）
*File In
**分析対象とするファイルを選ぶ
***その際に、「Filter」で、「All files (*.*)」にして、拡張子.txtも読めるように。
***「Add All」でフォルダー内ファイル全部
***「Done」で設定完了
***コマンドボックス内に「@」が表示される
*Tiers
**対象とするティアを選ぶ。話者行は「*speaker tier」
***具体的な話者記号を指定する場合は、右枠内に記入（例： *CHI）
***コマンドボックス内に「+t*」と表示
*Search
**対象とする文字列 word を指定（例：whenと入力）
***コマンドボックス内に「+s"when"」と表示
*右下の「Run」で実行
{{ref_image commandkwal.jpg}}
*カーソルキーの上下で、コマンドの履歴一覧を表示・選択できる
!実行結果
{{ref_image kwal.jpg}}
!!分析の仕方
!分析コード
*CLANを使って、大量のデータに対して分析コードをつける方法は以下を参照
https://sugiura-ken.org/wiki/wiki.cgi/exp?page=CLAN#p8
https://talkbank.org/manuals/CHAT.html#_Toc107417330

*CLANを使ってコードを付けることもできるが、
*CLANを使わずに、<<普通のテキストエディターでコードを付けてもよい>>

*ポイントは以下のようなコードがデータについていればよい
{{pre
$MOT:POS:Que
$MOT:POS:Res
$MOT:NEG:Que
$MOT:NEG:Res
$CHI:POS:Que
$CHI:POS:Res
$CHI:NEG:Que
$CHI:NEG:Res
}}

*コーディングのルールに従ってコードをつける
**$で始める
**階層関係は:で区切る（スペースなし）
**複数のコードを一つのティアに書く場合は、間に半角スペースを置く（単語を並べるのと同じ）
**コードを書くティアは%COD以外でも、自由にティア名を付けて作ってよい
 %COD: $N:Y $V:N

!分析コードの頻度算出
*CLANのFREQコマンドで、対象のティアを分析コードティアにして、頻度を出す。
*コードの頻度一覧が出る。


!!分析の例：文のタイプと文型の分析
!コード
*三つの分析ティア
**%SNT　文のタイプ
***DE 平叙, IN　疑問, IW　WH疑問, IM　命令, EX　感嘆
***S　単文, cSS　従＋主, ScS　主＋従, StS　主＋that節
**%CNS　文型
***s0 フラグメント, s1, s2, s3, s4, s5, s6, s7
***A 肯定, N 否定
***there構文, PASS受身
**%REC　関係節
***who, which, what, where, when, that
***nom 主格, obj 目的格, app 同格のthat

!実際のコーディング例（部分）
{{pre
*JPN501:	They are called "BUDO".
%NTV:	They are called budo.
%COM:	This word does not require capitalization.
%SNT:	$DE:S
%CNS:	$s5:A:PASS
*JPN501:	BUDO are JYUDO, KENDO, KYUDO and so on.
%NTV:	Budo include judo, kendo, kyudo, and so on.
%COM:	These words do not require capitalization.
%SNT:	$DE:S
%CNS:	$s2:A
*JPN501:	If you play BUDO, there is an important thing that you must remember.
%NTV:	If you play budo, there is one important thing you must remember. 
%COM:	
%SNT:	$DE:cSS
%CNS:	$s3:A $s1:A:there
%REC:	$that:obj
}}
!%SNT　文のタイプの頻度分析
{{ref_image freqSNT.jpg}}

!%CNS　文型の頻度分析
{{ref_image freqCNS.jpg}}

!%REC　関係節の頻度分析
{{ref_image freqREC.jpg}}