基本上我想在blockquotes之间删除单词文档。我是一个正则表达式newb甚至在使用rubular后,我也没有接近答案了。
感谢任何帮助。
答案 0 :(得分:10)
使用HTML解析器并忘记正则表达式。正则表达式无法正确处理HTML。
doc = Nokogiri::HTML(your_html)
doc.xpath("//blockquote").remove
来自:Strip text from HTML document using Ruby
如果你环顾四周,还有更多关于如何使用Nokogiri和XPath的例子。
答案 1 :(得分:0)
原始示例:
/<blockquote>([^<]*)<\/blockquote>/
答案 2 :(得分:0)
示例字符串:
&lt; blockquote&gt; Hello world&lt; / blockquote&gt;
在rubular中键入以下正则表达式 &LT; BLOCKQUOTE&GT;&LT(+。); / BLOCKQUOTE&GT;
或更通用的东西:
&LT。* GT;?(?+)&LT; /.*&GT;
希望它有所帮助!