Question

我尝试通过执行以下操作用空字符串替换html内容中的..标签内容。

string =  \n <img alt=\"testing artice breaking news\" src=\"something.com" />\n <p>\n \tnew vision content for testing rss feeds\n </p>\n "

我做了

string.gsub!(/<p.*?>|<\/p>/, '')

它只是用空字符串替换了和，但内容仍然保留。如何删除标签及其内容？

Answer 1

显然，您的正则表达式与...（及其内容）不匹配。试试这个：

string.gsub!(/.*<\/p>/, '')

test = '\n <img alt=\"testing artice breaking news\" src=\"something.com" />\n <p>\n \tnew vision content for testing rss feeds\n </p>\n "'
test.gsub(/<p>.*<\/p>/, '')

返回

"\\n <img alt=\\\"testing artice breaking news\\\" src=\\\"something.com\" />\\n \\n \""

另外，请考虑@Tom Lord的评论，您可以使用Nokogiri来操纵HTML。

使用ruby gsub替换html标签及其内容

1 个答案: