我在每个观察中都有一个包含大量文本的数据框,并希望通过将特定单词组合成一个单词来替换它们。这是我在此处找到的代码示例:Conditional gsub replacement
text = "this is a test this is another test test this is another test this is"
replace <- data.frame(symbol = c("this is", "test"), text=c("thisis", "yes"))
pat <- paste(replace[,"symbol"], collapse="|")
repeat {
m <- regexpr(pat, text)
if(m==-1) break
sym <- regmatches(text,m)
regmatches(text,m) <- replace[match(sym, replace[,"symbol"]), "text"]
}
text
但是,“替换”数据框有7614个替换值,我正在
“regexpr中的错误(pat,text):断言'tree-&gt; num_tags == num_tags'在执行regexp:file时失败 '../../../../../R-3.3.0/src/extra/tre/tre-compile.c',第634行“
到底有没有?