R R.scripts !!!grepExtract *Stanford Parser の解析結果を対象に検索をして、 *必要な統語関係のフレーズを抽出する。 *stringrパッケージがインストールしてあること。 {{pre install.packages("stringr", dependencies=T) library(stringr) }} *統語解析してあるテキストファイルの入っているディレクトリーをWorking Directoryに設定。 *list.files()でファイルを確認。 {{ref_text grepExtract.R}} {{ref grepExtract.R}} !例: 形容詞+名詞からなる名詞句の抽出 grepExtract("\\(NP \\(JJ \\w+?\\) \\(NN \\w*?\\)\\)") {{pre [5] "(NP (JJ broad) (NN knowledge))" [6] NA [7] NA [8] NA [9] NA [10] "(NP (JJ academic) (NN knowledge))" [11] NA [12] NA [13] "(NP (JJ contemporary) (NN anthropology))" }}