#chatToText #2020-01-17 sugiura@nagoya-u.jp #CHATフォーマットのファイルから、 #本文のメインティアのテキストだけを抜き出して #もとのファイル名に .data を付け足したファイル名で保存する。 chatToText <- function(){ #ディレクトリー内のすべてのテキストファイルを対象に here <- getwd() files <- list.files(here, pattern="\\.txt$") #読み込むファイル名で、.txt という拡張子でファイル名が終わるものを指定 for (i in files){ lines.tmp <- scan(i, what="char", sep="\n") data.tmp <- grep("\\*(JPN|NS)...:\t", lines.tmp, value=T) body.tmp <- gsub("\\*(JPN|NS)...:\t", "", data.tmp) body.tmp <- body.tmp[body.tmp != ""] filename <- i filename <- as.factor(filename) filename <- paste(filename, ".data", sep="") #もとのファイル名に .data という文字列を追加 #ファイル名の終わりが .txt ではなくなるので再帰的に読み込まれない write(body.tmp, file=filename) } }