如何使用R将多个文本从语料库转换为单数 我正在使用“tm”包,但我找不到任何功能。 我已尝试使用此功能,但我无法应用于语料库。
aggregate.plurals <- function (v) {
aggro_fen <- function(v, singular, plural) {
if (! is.na(v[plural])) {
v[singular] <- v[singular] + v[plural]
v <- v[-which(names(v) == plural)]
}
return(v)
}
for (n in names(v)) {
n_pl <- paste(n, 's', Sep='')
v <- aggro_fen(v, n, n_pl)
n_pl <- paste(n, 'es', Sep='')
v <- aggro_fen(v, n, n_pl)
}
return(v)
}
答案 0 :(得分:0)
如果您要进行文本分析,则可能会在比单数-复数更广泛的上下文中寻找单词转换。那将是干stem的,您可以直接在tm语料库上通过'tm_map'函数使用'SnowballC'中的'stemDocument'函数
reut21578 <- system.file("texts", "crude", package = "tm")
reuters <- VCorpus(DirSource(reut21578, mode = "binary"), readerControl = list(reader = readReut21578XMLasPlain))
tm_map(reuters, stemDocument)
资料来源:tm介绍论文https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf