*disclaimer
758410
[CHILDES]
IPSyn: Index of Productive Syntax
- IPSyn: Index of Productive Syntax
基づく文献
- Miller, 1981
Miller, J. F. (1981). Assessing language production in children: Experimental procedures (Vol. 1). University Park Press.
- Scarborough, 1990 が、文法範疇と構文の発達段階に関して、基づいた文献の一つ
- Scarborough, 1990
Scarborough, H.S. (1990). Index of Productive Syntax. Applied Psycholinguistics, 11, 1-22.
- 2歳から4歳の構文の発達のチェックシートとしてIPSynを開発
- Scarborough, 2008
- CLAN Changelog (2010)
- CLANでIPSynが使えるようになる
- "2010-08-25: IPSYN: created this new command" https://dali.talkbank.org/clan/changes.txt
- CLANでIPSynが使えるようになる
- Bernstein Ratner and MacWhinney (2016)
- Altenberg, Roberts, & Scarborough, (2018)
- IPSynの評価基準の見直し、定義の明確化
- Roberts et al., 2020
- MacWhinney et al., 2020
- Roberts et al., 2020の指摘を受けてIPSynを改善した結果報告
統語指標
- 59の統語形式が使われているかどうかでスコアを出す
- 違う形式で2回使われていたら2点
カテゴリ | 形式の数 | 得点(上限) |
---|---|---|
Noun Phrases (NP) | 11 | 22 |
Verb Phrases (VP) | 17 | 34 |
Questions and Negations (Q/N) | 11 | 22 |
Sentence Structures (SS) | 20 | 40 |
計 | 59 | 118 |
- この計がIPSynの総合スコア(満点118点)
準備
CLANのインストール
形態素解析プログラム MOR のインストールと実行
- MORをかけて、形態素タグ(%mor)と文法依存関係タグ(%gra)をつけておく
- MORをかけてないと、IPSynは動かない。
注意点
- 節構造を持つ発話が原則100必要
- 少ない場合、+cオプションで発話数を指定する。+c50 オプションの指定で、50発話で実施
- 発話が足りないとエラーメッセージが出る
CAN'T FIND NECESSARY SAMPLE SIZE OF 30 OF COMPLETE UTTERANCES. *CHI: FOUND ONLY 20 COMPLETE UTTERANCES IF YOU WANT TO USE SMALLER SAMPLE SIZE, THEN USE "+c" OPTION
- Yang et al. (2022)で、50で十分だとの結論。
コマンド
ipsyn +t*CHI -leng ファイル名.cha
- +t で分析するティア
- -l で分析する言語 eng を指定
- 出力ファイル: ファイル名.ipsyn.cex
Tips
- 発話が複数のファイルに分かれている場合、+u オプションでまとめる
- その際、対象ファイルをワイルドカードで指定するとよい
ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
> ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20 Using script file: C:\talkbank\clan\lib\ipsyn\eng.cut ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20 Sat Aug 21 21:56:00 2021 ipsyn (12-Aug-2021) is conducting analyses on: ONLY speaker main tiers matching: *CHI; and those speakers' ONLY dependent tiers matching: %MOR:; %GRA:; **************************************** From file <2007_1829_P01.cha> From file <2007_1829_P02.cha> From file <2007_1829_P03.cha> From file <2007_1829_P04.cha> From file <2007_1829_P05.cha> From file <2007_1829_P06.cha> From file <2007_1829_P07.cha> From file <2007_1829_P08.cha> From file <2007_1829_P09.cha> From file <2007_1829_P10.cha> Output file <2007_1829_P01.ipsyn.cex>
結果出力ファイル例 "2007_1829_P01.ipsyn.cex"
2007_1829_P01.ipsyn.cex.txt(147)
(参考)CLANに最初からついているサンプル
/examples/transcripts/ne32 folder ipsyn +t*CHI +leng 98.cha
98.ipsyn.cex が出力される(各発話にポイント付与)
98.ipcore.cex も出力される(分析対象の発話リスト)
IPSynのポイント付与方法
基本は、Scarborough 2008のAppendexに一覧が載っている
現在は、Altenberg et al. 2018のAppendex参照
具体的には、/CLAN/lib/ipsyn フォルダーに入っている eng.cut ファイルにルールが書いてある
- 例
RULENAME: V9 if INCLUDE: |mod ^ $V EXCLUDE: (I ^ think ^ so) + here + there DIFFERENT_STEMS: 1 if POINT: 2 INCLUDE: can't + won't
- INCLUDE行にマッチしたらポイントを得る
- EXCLUDE行に該当するものは除く
*CHI: it's a house ! %mor: pro:per|it~cop|be&3S det:art|a n|house ! %gra: 1|2|SUBJ 2|0|ROOT 3|4|DET 4|2|PRED 5|2|PUNCT
IPSynのルールの仕組み
MORコマンドが出力する形態素をまとめて「変数」として、その変数を使って、一般的ルールを記述している
- たとえば、名詞の$Nには、名詞,固有名詞,複数名詞の三つの形態素が含まれる。
- 修飾語$MODには、形容詞,冠詞,所有限定詞,数詞,指示代名詞,数量詞の六つの形態素が含まれる。
% The following is the list of variables used in the rules. % Variables are marked in rules with $, as in $N. N = |n,|n:prop,|n:pt V = |v,|cop,|aux AMC = |aux,|mod,|cop PRO = |pro:per,|pro:indef,|pro:refl,|pro:obj,|pro:sub,|pro:int MOD += |adj,|det:art,|det:poss,|det:num,|det:dem,|qn ART = |det:art DET = |det:dem ADV = |adv,|adv:tem NP = $N + $PRO + ($MOD ^ $N) + ($DET ^ $N) + ($ART ^ $N) + ($ART ^ $MOD ^ $N) + ($DET ^ $MOD ^ $N)
MORコマンドでつけられる形態素は細かい
https://talkbank.org/manuals/MOR.html
Category | Code |
---|---|
Adjective | adj |
Adjective - Predicative | adj:pred |
Adverb | adv |
Adverb - Temporal | adv:tem |
Communicator | co |
Complementizer | comp |
Conjunction | conj |
Coordinator | coord |
Determiner Article | det:art |
Determiner - Demonstrative | det:dem |
Determiner - Interrogative | det:int |
Determiner - Numeral | det:num |
Determiner - Possessive | det:poss |
Filler | fil |
Infinitive | inf |
Negative | neg |
Noun | n |
Noun - letter | n:let |
Noun - plurale tantum | n:pt |
Proper Noun | n:prop |
Onomatopoeia | on |
Particle | part |
Postmodifier | post |
Preposition | prep |
Pronoun - demonstrative | pro:dem |
Pronoun - existential | pro:exist |
Pronoun - indefinite | pro:indef |
Pronoun - interrogative | pro:int |
Pronoun - object | pro:obj |
Pronoun - personal | pro:per |
Pronoun - possessive | pro:poss |
Pronoun - reflexive | pro:refl |
Pronoun - relative | pro:rel |
Pronoun - subject | pro:sub |
Quantifier | qn |
Verb | v |
Verb - auxiliary | aux |
Verb - copula | cop |
Verb - modal | mod |
https://sugiura-ken.org/wiki/