R:根据表格将文字中的两个单词连接起来

时间:2018-10-22 08:09:49

标签: r nlp

在R中,我遇到以下问题:

在文本中,我想组合一些具有特定含义的单词(从两个到三个)。 c(“ a b”,“ c d e”)

在文本中,我希望每两个单词出现在给定的文本中,但我希望拥有相同的文本,但是当这两个单词一起出现时,它们会用“ _”绑定。

示例:这是一个“ a”“ b”,并且很漂亮。 “ c d e”更昂贵。

会变成:这是一个“ a” _b”,它很漂亮。“ c_d_e”更贵。

谢谢

1 个答案:

答案 0 :(得分:0)

regex可能是您的解决方案。 请尝试以下操作:

library(stringr)
text <-  "This is an \"a b\" and its beautiful. \"c d e\" are more expensive."

str_replace(string = text, pattern = "(?<=a)[:blank:](?=b)", replacement = "_")
[1] "This is an \"a_b\" and its beautiful. \"c d e\" are more expensive."

“(?? == a):空白:”此模式匹配所有以“ a”开头和以“ b”开头的空格。

然后您可以弄清楚如何匹配“ cd”,等等;)

有关更多信息,请访问此处:https://stringr.tidyverse.org/

祝你好运, L