如何逃避“<” “>” 中介于两者之间的一切?

时间:2017-08-29 17:33:44

标签: r string

我有一个包含混合人类语言和HTML的字符串变量。我想删除嵌入在“<”中的所有HTML部分和“>”。我尝试了以下方法:

gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE);

但我被告知\&lt;是无效的逃脱。任何人都可以帮我解决这个问题吗?非常感谢!

1 个答案:

答案 0 :(得分:2)

gsub可以替换<tags>并在<tags>之间输出内容。

> str
[1] "<font size=6>Done with payin good ol Sallie Mae for my learnin at the institushin.</font>"

> gsub("<.*?>","", str)
[1] "Done with payin good ol Sallie Mae for my learnin at the institushin."