*disclaimer
247115
[CHILDES]
IPSyn: Index of Productive Syntax
基づく文献
- Miller, 1981
Miller, J. F. (1981). Assessing language production in children: Experimental procedures (Vol. 1). University Park Press.
- Scarborough, 1990 が、文法範疇と構文の発達段階に関して、基づいた文献の一つ
- Scarborough, 1990
Scarborough, H.S. (1990). Index of Productive Syntax. Applied Psycholinguistics, 11, 1-22.
- 2歳から4歳の構文の発達のチェックシートとしてIPSynを開発
- Scarborough, 2008
- Bernstein Ratner and MacWhinney (2016)
- Altenberg, Roberts, & Scarborough, 2018
- Roberts et al., 2020
- MacWhinney et al., 2020
- Roberts et al., 2000の指摘を受けてIPSynを改善した結果報告
統語指標
- 60あまりの統語形式が使われているかどうかでスコアを出す
準備
CLANのインストール
形態素解析プログラム MOR のインストールと実行
- MORをかけて、形態素タグ(%mor)と文法依存関係タグ(%gra)をつけておく
- MORをかけてないと、IPSynは動かない。
注意点
- 節構造を持つ発話が原則100必要
- 少ない場合、+cオプションで発話数を指定する。+c50 オプションの指定で、50発話で実施
- 発話が足りないとエラーメッセージが出る
CAN'T FIND NECESSARY SAMPLE SIZE OF 30 OF COMPLETE UTTERANCES. *CHI: FOUND ONLY 20 COMPLETE UTTERANCES IF YOU WANT TO USE SMALLER SAMPLE SIZE, THEN USE "+c" OPTION
コマンド
ipsyn +t*CHI -leng ファイル名.cha
- +t で分析するティア
- -l で分析する言語 eng を指定
- 出力ファイル: ファイル名.ipsyn.cex
Tips
- 発話が複数のファイルに分かれている場合、+u オプションでまとめる
- その際、対象ファイルをワイルドカードで指定するとよい
ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
> ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20 Using script file: C:\talkbank\clan\lib\ipsyn\eng.cut ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20 Sat Aug 21 21:56:00 2021 ipsyn (12-Aug-2021) is conducting analyses on: ONLY speaker main tiers matching: *CHI; and those speakers' ONLY dependent tiers matching: %MOR:; %GRA:; **************************************** From file <2007_1829_P01.cha> From file <2007_1829_P02.cha> From file <2007_1829_P03.cha> From file <2007_1829_P04.cha> From file <2007_1829_P05.cha> From file <2007_1829_P06.cha> From file <2007_1829_P07.cha> From file <2007_1829_P08.cha> From file <2007_1829_P09.cha> From file <2007_1829_P10.cha> Output file <2007_1829_P01.ipsyn.cex>
結果出力ファイル例 "2007_1829_P01.ipsyn.cex"
2007_1829_P01.ipsyn.cex.txt(56)
(参考)CLANに最初からついているサンプル
/examples/transcripts/ne32 folder ipsyn +t*CHI +leng 98.cha
98.ipsyn.cex が出力される(各発話にポイント付与)
98.ipcore.cex も出力される(分析対象の発話リスト)
IPSynのポイント付与方法
基本は、Scarborough 2008のAppendexに一覧が載っている
具体的には、/CLAN/lib/ipsyn フォルダーに入っている eng.cut ファイルにルールが書いてある
- 例
RULENAME: V9 if INCLUDE: |mod ^ $V EXCLUDE: (I ^ think ^ so) + here + there DIFFERENT_STEMS: 1 if POINT: 2 INCLUDE: can't + won't
- INCLUDE行にマッチしたらポイントを得る
- EXCLUDE行に該当するものは除く
*CHI: it's a house ! %mor: pro:per|it~cop|be&3S det:art|a n|house ! %gra: 1|2|SUBJ 2|0|ROOT 3|4|DET 4|2|PRED 5|2|PUNCT
https://sugiura-ken.org/wiki/