Question

text＆lt; -c（'Epson Korea，一家以彩色打印机而闻名的公司   投影仪，在当地展示了由Android OS驱动的智能眼镜   电影院CGV在首尔清潭洞，早上   星期三。智能眼镜的显示器可以戴在头上   佩戴者可以躺着看电影。 “）

模式＆lt; -c（'电影CGV清潭首尔'）

我想仅使用该模式从文本中减去句子，就像这样。

首尔清潭洞的电影院CGV

所以我尝试使用'grep'和'substr'，但这并不容易。

pattern2＆lt; -c（'movie |。* | CGV |。* | Cheongdam |。* | Seoul'）

t＆lt; -strsplit（text，''）

m＆lt; -grep（pattern2，text）

SUBSTR（T，M，ATTR（米， “match.length”））

怎么做？

Answer 1

regmatches(text, regexpr('movie.*Seoul', text))

Answer 2

您还可以使用sub功能：

sub(".*\\b(movie\\b.*\\bSeoul)\\b.*", "\\1", text)
# [1] "movie theater CGV in Cheongdam-dong, Seoul"

如何在文本中找到模式并在r中减去它

2 个答案: