从字符串中删除HTML标记(R编程)

时间:2010-09-22 01:40:30

标签: html r tags

是否有一种简单的方法可以从R?

中的字符串中删除HTML标记

目前我正在从XML文档中提取调查数据,并且问题的标题中包含来自调查设计的HTML,就像这样。

"Why did you give this performance question a low score?<br />"

如何轻松删除<br />

任何帮助都将不胜感激。

1 个答案:

答案 0 :(得分:4)

查看?gsub?regex。以下是一些删除<br />的简单代码,但它不适用于所有可能的HTML代码。

> string <- "Why did you give this performance question a low score?<br />"
> gsub("<.*/>","",string)
[1] "Why did you give this performance question a low score?"