トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

R.package

*disclaimer

R.package Rで便利なパッケージ


 tm

https://www.rdocumentation.org/packages/tm/versions/0.7-3

  • Boost_tokenizer(x)
  • MC_tokenizer(x)
  • removePunctuation(tmp)
  • removeNumbers(x)

tmp.v <- Vectorsource(tmp)
tmp.c <- Corpus(tmp.v)
tmpc.td <- TermDocumentMatrix(tmp.c)
findFreqTerms(tmpc.td)
 findMostFreqTerms(tmpc.td)
$`1`
     the     said      and computer      its terminal 
      15        7        6        6        5        5