*disclaimer
1198495
checkWordList.R
- 語彙リストを比較する
- 一単語一行
- types2にチェックしたい単語リスト(例えば学生のエッセイ)
- wordlistに参照したい語彙リスト(例えばJACET8000等の語彙リスト)
- 一般的な語彙リストには含まれない「珍しい」単語の一覧が出る
- めっちゃ遅い
- 含まれない単語の数が、一個多い? (2019-12-23)
- setdiffと同じこと
- 参考: intersect こちらは共通部分の抽出
checkWordList2.R(526)
# 2018-03-29 copyleft sugiura@nagoya-u.jp
checkWordList2 <- function(a,b){
types2 <- a
wordlist <- b
i <- 0
k <- 0
koreda <- 0
k <- length(types2)
w <- length(wordlist)
cat("words to check:", k, "\n")
cat("base word list:", w)
for(i in 1:k){
are <- types2[i]
fuitti <- 0
itti <- 0
for(j in 1:w){
kore <- wordlist[j]
if(are == kore){
itti <- itti + 1
} else {
fuitti <- fuitti + 1
}
if(length(wordlist) == fuitti){
koreda <- c(koreda, i)
}
}
}
for(h in 1:length(koreda)){
m <- koreda[h]
print(types2[m])
}
cat(length(koreda), "rare words")
}
checkWordList.R(530)
# 2018-03-24 copyleft sugiura@nagoya-u.jp
checkWordList <- function(){
i <- 0
k <- 0
koreda <- 0
k <- length(types2)
w <- length(wordlist)
cat("words to check:", k, "\n")
cat("base word list:", w)
for(i in 1:k){
are <- types2[i]
fuitti <- 0
itti <- 0
for(j in 1:w){
kore <- wordlist[j]
if(are == kore){
itti <- itti + 1
} else {
fuitti <- fuitti + 1
}
if(length(wordlist) == fuitti){
koreda <- c(koreda, i)
}
}
}
for(h in 1:length(koreda)){
m <- koreda[h]
print(types2[m])
}
cat(length(koreda), "rare words")
}
https://sugiura-ken.org/wiki/