トップ 履歴 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

IPSyn

*disclaimer
758410

[CHILDES]

IPSyn: Index of Productive Syntax


 基づく文献

  • Miller, 1981
Miller, J. F. (1981). Assessing language production in children: Experimental procedures (Vol. 1). University Park Press.
    • Scarborough, 1990 が、文法範疇と構文の発達段階に関して、基づいた文献の一つ
  • Scarborough, 1990
Scarborough, H.S. (1990). Index of Productive Syntax. Applied Psycholinguistics, 11, 1-22.
    • 2歳から4歳の構文の発達のチェックシートとしてIPSynを開発
  • Scarborough, 2008
  • CLAN Changelog (2010)
  • Bernstein Ratner and MacWhinney (2016)
    • IPSynとDSSを比較し、就学前の言語発達の評価にはIPSynの方がよいと判断
  • Altenberg, Roberts, & Scarborough, (2018)
    • IPSynの評価基準の見直し、定義の明確化
  • Roberts et al., 2020
    • CLANIPSynの評価結果と人手での評価結果を比較し、不正確な点を指摘
  • MacWhinney et al., 2020
    • Roberts et al., 2020の指摘を受けてIPSynを改善した結果報告

 統語指標

  • 59の統語形式が使われているかどうかでスコアを出す
  • 違う形式で2回使われていたら2点

カテゴリ形式の数得点(上限)
Noun Phrases (NP)1122
Verb Phrases (VP)1734
Questions and Negations (Q/N)1122
Sentence Structures (SS)2040
59118

  • この計がIPSynの総合スコア(満点118点)

 準備


CLANのインストール



形態素解析プログラム MOR のインストールと実行


  • MORをかけて、形態素タグ(%mor)と文法依存関係タグ(%gra)をつけておく

  • MORをかけてないと、IPSynは動かない。

 注意点

  • 節構造を持つ発話が原則100必要
    • 少ない場合、+cオプションで発話数を指定する。+c50 オプションの指定で、50発話で実施
    • 発話が足りないとエラーメッセージが出る
CAN'T FIND NECESSARY SAMPLE SIZE OF 30 OF COMPLETE UTTERANCES.
*CHI: FOUND ONLY 20 COMPLETE UTTERANCES
IF YOU WANT TO USE SMALLER SAMPLE SIZE, THEN USE "+c" OPTION


  • Yang et al. (2022)で、50で十分だとの結論。

 コマンド

ipsyn +t*CHI -leng ファイル名.cha

  • +t で分析するティア
  • -l で分析する言語 eng を指定

  • 出力ファイル: ファイル名.ipsyn.cex

Tips

  • 発話が複数のファイルに分かれている場合、+u オプションでまとめる
  • その際、対象ファイルをワイルドカードで指定するとよい

ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20

> ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
    Using script file: C:\talkbank\clan\lib\ipsyn\eng.cut
ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
Sat Aug 21 21:56:00 2021
ipsyn (12-Aug-2021) is conducting analyses on:
  ONLY speaker main tiers matching: *CHI;
	and those speakers' ONLY dependent tiers matching: %MOR:; %GRA:;
****************************************
From file <2007_1829_P01.cha>
From file <2007_1829_P02.cha>
From file <2007_1829_P03.cha>
From file <2007_1829_P04.cha>
From file <2007_1829_P05.cha>
From file <2007_1829_P06.cha>
From file <2007_1829_P07.cha>
From file <2007_1829_P08.cha>
From file <2007_1829_P09.cha>
From file <2007_1829_P10.cha>
Output file <2007_1829_P01.ipsyn.cex>

結果出力ファイル例 "2007_1829_P01.ipsyn.cex"

2007_1829_P01.ipsyn.cex.txt(147)




(参考)CLANに最初からついているサンプル

/examples/transcripts/ne32 folder

ipsyn +t*CHI +leng 98.cha

98.ipsyn.cex が出力される(各発話にポイント付与)
98.ipcore.cex も出力される(分析対象の発話リスト



 IPSynのポイント付与方法

基本は、Scarborough 2008のAppendexに一覧が載っている

現在は、Altenberg et al. 2018のAppendex参照

具体的には、/CLAN/lib/ipsyn フォルダーに入っている eng.cut ファイルにルールが書いてある

RULENAME: V9
if
INCLUDE:	|mod ^ $V
EXCLUDE:	(I ^ think ^ so) + here + there
DIFFERENT_STEMS:	1
if
POINT:	2
INCLUDE:	can't + won't
  • INCLUDE行にマッチしたらポイントを得る
  • EXCLUDE行に該当するものは除く

*CHI:	it's a house !
%mor:	pro:per|it~cop|be&3S det:art|a n|house !
%gra:	1|2|SUBJ 2|0|ROOT 3|4|DET 4|2|PRED 5|2|PUNCT

 IPSynのルールの仕組み


MORコマンドが出力する形態素をまとめて「変数」として、その変数を使って、一般的ルールを記述している

  • たとえば、名詞の$Nには、名詞,固有名詞,複数名詞の三つの形態素が含まれる。
  • 修飾語$MODには、形容詞,冠詞,所有限定詞,数詞,指示代名詞,数量詞の六つの形態素が含まれる。
% The following is the list of variables used in the rules.
% Variables are marked in rules with $, as in $N.
N  = |n,|n:prop,|n:pt
V  = |v,|cop,|aux
AMC = |aux,|mod,|cop
PRO   = |pro:per,|pro:indef,|pro:refl,|pro:obj,|pro:sub,|pro:int
MOD += |adj,|det:art,|det:poss,|det:num,|det:dem,|qn
ART = |det:art
DET = |det:dem
ADV   = |adv,|adv:tem
NP   = $N + $PRO + ($MOD ^ $N) + ($DET ^ $N) + ($ART ^ $N) + ($ART ^ $MOD ^ $N) + ($DET ^ $MOD ^ $N)

MORコマンドでつけられる形態素は細かい


https://talkbank.org/manuals/MOR.html

Category Code
Adjective adj
Adjective - Predicative adj:pred
Adverb adv
Adverb - Temporal adv:tem
Communicator co
Complementizer comp
Conjunction conj
Coordinator coord
Determiner Article det:art
Determiner - Demonstrative det:dem
Determiner - Interrogative det:int
Determiner - Numeral det:num
Determiner - Possessive det:poss
Filler fil
Infinitive inf
Negative neg
Noun n
Noun - letter n:let
Noun - plurale tantum n:pt
Proper Noun n:prop
Onomatopoeia on
Particle part
Postmodifier post
Preposition prep
Pronoun - demonstrative pro:dem
Pronoun - existential pro:exist
Pronoun - indefinite pro:indef
Pronoun - interrogative pro:int
Pronoun - object pro:obj
Pronoun - personal pro:per
Pronoun - possessive pro:poss
Pronoun - reflexive pro:refl
Pronoun - relative pro:rel
Pronoun - subject pro:sub
Quantifier qn
Verb v
Verb - auxiliary aux
Verb - copula cop
Verb - modal mod