R模式替换:nfa有太多状态

时间:2016-06-28 17:58:45

标签: regex r

我在每个观察中都有一个包含大量文本的数据框,并希望通过将特定单词组合成一个单词来替换它们。这是我在此处找到的代码示例:Conditional gsub replacement

text = "this is a test this is another test test this is another test this is"
replace <- data.frame(symbol = c("this is", "test"), text=c("thisis", "yes"))
pat <-  paste(replace[,"symbol"], collapse="|")
repeat {
    m <- regexpr(pat, text)
    if(m==-1) break
    sym <- regmatches(text,m)
    regmatches(text,m) <- replace[match(sym, replace[,"symbol"]), "text"]
}
text

但是,“替换”数据框有7614个替换值,我正在

  

“regexpr中的错误(pat,text):断言'tree-&gt; num_tags ==   num_tags'在执行regexp:file时失败   '../../../../../R-3.3.0/src/extra/tre/tre-compile.c',第634行“

到底有没有?

0 个答案:

没有答案