トップ履歴一覧 Farm ソース検索ヘルプ PDF RSS ログイン

CLANdeNICER

CLANでNICERを処理する

CHATに基づくNICERのフォーマット

共通点

ファイルは@Beginで始まり@Endで終わる。
「ヘッダー情報」は、ファイルの先頭部分で、行頭に@項目名で示す
「本文部分」は、行頭にアスタリスク＋話者記号で、一発話一行で記述
各発話の関連情報は、発話の下（次の発話との間）に、行頭に%項目名で示す
行の先頭の項目名と内容との間は、コロンとタブで区切る

CHATフォーマット

minCHATという最低限の枠

@Begin
@Languages:	eng
@Participants:	CHI
@ID:	
*CHI:	
@End

NICERのフォーマット

ヘッダー情報の注意点
- @Qualification で英語力を示す試験のスコア情報
- @Abroad で海外滞在経験
- @Topic でエッセイのトピック
- @Criterion で、そのエッセイをCriterionにかけた時の評価スコア（6点満点）

@Begin
@Participants:	JPN501
@PID:	PIDJP501
@Age:	21
@Sex:	F
@YearInSchool:	U2
@Major:	agriculture
@StudyHistory:	8
@OtherLanguage:	Chinese=1.0;none=
@Qualification:	TOEIC=590(2013);none=;none=
@Abroad:	none=;none=
（中略）
@Topic:	sports
@Criterion:	4
（中略）
*JPN501:	What kind of sports do you like?
%NTV:	OK
%COM:	
（本文以下省略）
@End

本文部分
- *JPN501 は話者記号
- %NTV は英語母語の添削者による訂正（書き換え）文
- %COM は添削時のコメント

この3行がセットとなって、発話の数だけ含まれる

実例: JPN501.txt

CLANの準備

インストール

workingディレクトリーの設定

CLAN起動後、コマンド・ウィンドウ内の一番上「working」で設定
- 分析対象とするファイルを入れたフォルダーを指定
  - あらかじめ、分析対象とするファイルを選んでおくのがコツ

CLANの実行

コマンド・ウィンドウ

Progs
- コマンドを選ぶ（例：検索 kwal）
- コマンドボックス内に選んだコマンドが表示される
- 選んだコマンドに応じて、ボタンが表示される（例：「File In」「Tiers」「Search」）
File In
- 分析対象とするファイルを選ぶ
  - その際に、「Filter」で、「All files (*.*)」にして、拡張子.txtも読めるように。
  - 「Add All」でフォルダー内ファイル全部
  - 「Done」で設定完了
  - コマンドボックス内に「@」が表示される
Tiers
- 対象とするティアを選ぶ。話者行は「*speaker tier」
  - 具体的な話者記号を指定する場合は、右枠内に記入（例： *CHI）
  - コマンドボックス内に「+t*」と表示
Search
- 対象とする文字列 word を指定（例：whenと入力）
  - コマンドボックス内に「+s"when"」と表示
右下の「Run」で実行

カーソルキーの上下で、コマンドの履歴一覧を表示・選択できる

実行結果

分析の仕方

分析コード

CLANを使って、大量のデータに対して分析コードをつける方法は以下を参照

https://sugiura-ken.org/wiki/wiki.cgi/exp?page=CLAN#p8
https://talkbank.org/manuals/CHAT.html#_Toc107417330

CLANを使ってコードを付けることもできるが、
CLANを使わずに、普通のテキストエディターでコードを付けてもよい

ポイントは以下のようなコードがデータについていればよい

$MOT:POS:Que
$MOT:POS:Res
$MOT:NEG:Que
$MOT:NEG:Res
$CHI:POS:Que
$CHI:POS:Res
$CHI:NEG:Que
$CHI:NEG:Res

コーディングのルールに従ってコードをつける
- $で始める
- 階層関係は:で区切る（スペースなし）
- 複数のコードを一つのティアに書く場合は、間に半角スペースを置く（単語を並べるのと同じ）
- コードを書くティアは%COD以外でも、自由にティア名を付けて作ってよい

%COD: $N:Y $V:N

分析コードの頻度算出

CLANのFREQコマンドで、対象のティアを分析コードティアにして、頻度を出す。
コードの頻度一覧が出る。

分析の例：文のタイプと文型の分析

コード

三つの分析ティア
- %SNT　文のタイプ
  - DE 平叙, IN　疑問, IW　WH疑問, IM　命令, EX　感嘆
  - S　単文, cSS　従＋主, ScS　主＋従, StS　主＋that節
- %CNS　文型
  - s0 フラグメント, s1, s2, s3, s4, s5, s6, s7
  - A 肯定, N 否定
  - there構文, PASS受身
- %REC　関係節
  - who, which, what, where, when, that
  - nom 主格, obj 目的格, app 同格のthat

実際のコーディング例（部分）

*JPN501:	They are called "BUDO".
%NTV:	They are called budo.
%COM:	This word does not require capitalization.
%SNT:	$DE:S
%CNS:	$s5:A:PASS
*JPN501:	BUDO are JYUDO, KENDO, KYUDO and so on.
%NTV:	Budo include judo, kendo, kyudo, and so on.
%COM:	These words do not require capitalization.
%SNT:	$DE:S
%CNS:	$s2:A
*JPN501:	If you play BUDO, there is an important thing that you must remember.
%NTV:	If you play budo, there is one important thing you must remember. 
%COM:	
%SNT:	$DE:cSS
%CNS:	$s3:A $s1:A:there
%REC:	$that:obj

%SNT　文のタイプの頻度分析

%CNS　文型の頻度分析

%REC　関係節の頻度分析

https://sugiura-ken.org/wiki/

Menu

keyword

category

[GLMM]
[Linux]
[HSP]
[R]
[Python]
[Corpus]
[Google]

更新履歴

2024/4/24

2024/4/23

stringr

2024/4/22

2024/4/16

sugiura-ken

2024/4/6

sjPlot

2024/4/5

MicrosoftTeams

2024/3/23

順序ロジスティック回帰

2024/3/22

ggplot2

2024/3/20

emmeans

2024/3/16

Windows11

2024/3/8

R

2024/1/28

sakura editor

2024/1/17

spacyr

2024/1/16

Excel.tips

2024/1/11

2024/1/10

dplyr

2024/1/8

sum contrasts

2024/1/6

jtools

2024/1/3

contrast coding

2023/12/29

abline()

2023/12/22

Word.tips

2023/12/21

easystats

2023/12/20

table()

2023/12/15

Constructional Diversity Analyzer

2023/12/11

Kivy

2023/12/8

多重比較

2023/12/1

Multiple Regression Analysis

2023/11/30

performance

2023/11/26

2023/11/23

相関係数の検定

2023/11/19

2023/11/18

SCA

2023/11/15

Emacs

2023/11/10

inkscape

2023/11/8

forward digit span test

2023/10/29

2023/10/28

ChatGPT

2023/10/26

Thunderbird

2023/10/23

IPSyn

2023/10/21

AntConc

2023/10/16

Outlook

2023/10/15

GoogleSlides

2023/10/9

HSP

2023/10/7

Edge

2023/9/29

TeX

2023/9/27

Discord

2023/9/26

NUCT

2023/9/25

Freemind

2023/9/19

2023/9/18

fitdistrplus

2023/9/17

ICC

2023/9/16

2023/9/14

ownCloud

2023/8/22

xtabs()

2023/8/20

モデル選択

2023/8/8

2023/7/29

Git

2023/7/28

Overleaf

2023/7/21

Zotero

2023/7/13

Beamer

2023/7/11

simpleboot

2023/7/10

2023/7/9

lingpsych

2023/6/28

Brunner-Munzel検定

2023/6/21

2023/6/18

DALL.E

2023/6/17

glmmTMB
Menu

2023/6/13

Bing Image Creator

2023/6/12

ggeffects

2023/6/7

ExpbyHSP

2023/6/2

ifelse

2023/5/30

TextForHSP04

2023/5/25

facet

2023/5/24

TextForHSP03

2023/5/16

antisaccade test

2023/5/10

TextForHSP

2023/5/9

2023/5/2

geom_boxplot()

2023/4/28

mutate()

2023/4/14

CloudLaTeX

2023/4/10

MicrosoftOffice

2023/3/26

反応時間の分析

2023/3/24

p.adjust

2023/3/22

Tobii

2023/3/11

2023/3/7

CHAT

2023/2/21

SQL

2023/2/20

TACT

2023/1/25

COCA

2023/1/19

R.package

2023/1/15

stopwords

2022/12/28

2022/12/26

flexplot

2022/12/25

2022/12/23

VIF

2022/12/20

2022/12/16

Zoom

2022/12/14

PowerPoint

2022/12/13

Reading Progress