我有一个包含混合人类语言和HTML的字符串变量。我想删除嵌入在“<”中的所有HTML部分和“>”。我尝试了以下方法:
gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE);
但我被告知\&lt;是无效的逃脱。任何人都可以帮我解决这个问题吗?非常感谢!
答案 0 :(得分:2)
gsub
可以替换<tags>
并在<tags>
之间输出内容。
> str
[1] "<font size=6>Done with payin good ol Sallie Mae for my learnin at the institushin.</font>"
> gsub("<.*?>","", str)
[1] "Done with payin good ol Sallie Mae for my learnin at the institushin."