トップ 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

IPSyn

*disclaimer
178045

[CHILDES]

IPSyn: Index of Productive Syntax


 基づく文献

  • Scarborough, 1990
  • Scarborough, 2008
  • Altenberg, Roberts, & Scarborough, 2018
  • Roberts et al., 2020
  • MacWhinney et al., 2020

 統語指標

  • 60あまりの統語形式が使われているかどうかでスコアを出す


 準備


CLANのインストール



形態素解析プログラム MOR のインストールと実行


  • MORをかけて、形態素タグ(%mor)と文法依存関係タグ(%gra)をつけておく

  • MORをかけてないと、IPSynは動かない。

 注意点

  • 節構造を持つ発話が原則100必要
    • 少ない場合、+cオプションで発話数を指定する。+c50 オプションの指定で、50発話で実施
    • 発話が足りないとエラーメッセージが出る
CAN'T FIND NECESSARY SAMPLE SIZE OF 30 OF COMPLETE UTTERANCES.
*CHI: FOUND ONLY 20 COMPLETE UTTERANCES
IF YOU WANT TO USE SMALLER SAMPLE SIZE, THEN USE "+c" OPTION

 コマンド

ipsyn +t*CHI -leng ファイル名.cha

  • +t で分析するティア
  • -l で分析する言語 eng を指定

  • 出力ファイル: ファイル名.ipsyn.cex

Tips

  • 発話が複数のファイルに分かれている場合、+u オプションでまとめる
  • その際、対象ファイルをワイルドカードで指定するとよい

ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20

> ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
    Using script file: C:\talkbank\clan\lib\ipsyn\eng.cut
ipsyn +t*CHI -leng 2007_1829_P*.cha +u +c20
Sat Aug 21 21:56:00 2021
ipsyn (12-Aug-2021) is conducting analyses on:
  ONLY speaker main tiers matching: *CHI;
	and those speakers' ONLY dependent tiers matching: %MOR:; %GRA:;
****************************************
From file <2007_1829_P01.cha>
From file <2007_1829_P02.cha>
From file <2007_1829_P03.cha>
From file <2007_1829_P04.cha>
From file <2007_1829_P05.cha>
From file <2007_1829_P06.cha>
From file <2007_1829_P07.cha>
From file <2007_1829_P08.cha>
From file <2007_1829_P09.cha>
From file <2007_1829_P10.cha>
Output file <2007_1829_P01.ipsyn.cex>

結果出力ファイル例 "2007_1829_P01.ipsyn.cex"

2007_1829_P01.ipsyn.cex.txt(11)




(参考)CLANに最初からついているサンプル

/examples/transcripts/ne32 folder

ipsyn +t*CHI +leng 98.cha

98.ipsyn.cex が出力される(各発話にポイント付与)
98.ipcore.cex も出力される(分析対象の発話リスト



 IPSynのポイント付与方法

基本は、Scarborough 2008のAppendexに一覧が載っている

具体的には、/CLAN/lib/ipsyn フォルダーに入っている eng.cut ファイルにルールが書いてある

RULENAME: V9
if
INCLUDE:	|mod ^ $V
EXCLUDE:	(I ^ think ^ so) + here + there
DIFFERENT_STEMS:	1
if
POINT:	2
INCLUDE:	can't + won't
  • INCLUDE行にマッチしたらポイントを得る
  • EXCLUDE行に該当するものは除く

*CHI:	it's a house !
%mor:	pro:per|it~cop|be&3S det:art|a n|house !
%gra:	1|2|SUBJ 2|0|ROOT 3|4|DET 4|2|PRED 5|2|PUNCT