Question

我的文字类似于：

<p>some text ...</p><p>The post <a href="http://url_address/">text...</a> appeared first on <a href="http://url_address">some another text</a>.</p>

我需要删除<p>The post中的所有内容，结果将是：

<p>some text ...</p>

我正在尝试这样做：

text.sub!(/^<p>The post/, '')

但它只返回一个空字符串......如何修复它？

Answer 1

您的正则表达式不正确。它匹配字符串开头的每个<p>The post。你想要相反：匹配从它的位置到字符串的结尾。看看这个。

s = '<p>some text ...</p><p>The post <a href="http://url_address/">text...</a> appeared first on <a href="http://url_address">some another text</a>.</p>'

s.sub(/<p>The\spost.*$/, '') # => "<p>some text ...</p>"

Answer 2

'^'匹配整个字符串的开头。尝试做

text.sub!(/<p>The post/, '')

编辑只是仔细阅读...

text.sub!(/<p>The post.*$/, '')

Answer 3

您指定了^，它与字符串的开头匹配。你应该做

text.sub!(/<p>The post.*$/, '')

在http://rubular.com/r/c91EbHN0Af

中使用此功能

Ruby - 删除部分文本

3 个答案: