我正在尝试使用content_transform
函数将两个单词合并为一个,作为R中tm
包的一部分。
例如,我有位置数据和创建文字云我需要结合“san jose”,“san diego”,“san francisco”)否则“san”出现是最常用的词。
据我所知,正在创建一个函数,例如,
combineUK <- content_transformer(function(x, pattern)
gsub(pattern,"UK",x,ignore.case = T))
然而,分别为每个城镇创建功能是不现实的。
我想知道是否有任何方法可以在paste()
内实施content_transform
功能?
所以,也许我错过了一些明显的东西。
答案 0 :(得分:2)
由于您没有提供完整的可重复示例(复制粘贴可运行),因此我不知道您拥有什么以及您想要什么。但是,请考虑例如
library(tm)
library(wordcloud)
par(mfrow = c(2,1), cex=.5)
txt <- c("hello san jose dudes", "welcome to san diego", "Did you like san francisco")
corp <- Corpus(VectorSource(txt))
wordcloud(corp, min.freq=1)
corp <- tm_map(corp, content_transformer(function(x) gsub("(san).(\\w+)", "\\1\\2", x, ignore.case = TRUE)))
wordcloud(corp, min.freq=1)