是否有一种简单的方法可以从R?
中的字符串中删除HTML标记目前我正在从XML文档中提取调查数据,并且问题的标题中包含来自调查设计的HTML,就像这样。
"Why did you give this performance question a low score?<br />"
如何轻松删除<br />
?
任何帮助都将不胜感激。
答案 0 :(得分:4)
查看?gsub
和?regex
。以下是一些删除<br />
的简单代码,但它不适用于所有可能的HTML代码。
> string <- "Why did you give this performance question a low score?<br />"
> gsub("<.*/>","",string)
[1] "Why did you give this performance question a low score?"