除了内容之外,如何获取层次结构中的所有html标签?

时间:2014-12-08 10:29:47

标签: html ruby-on-rails ruby regex

我想获得html标签模式或给定html内容的布局。

例如:以下是给定的html内容

<p style="font-size: 11px">
  <strong>Sample Director</strong><br>
  ABC Name<br>
  Test Sign Association<br>
  12345 N. 85th Ave., Ste. D345<br>
  Test, NY  85308<br>
  Wk.:  602-385-1234;  Cell:   602-079-1234<br>
  Fax:  602-987-1244<br>
  <a href="mailto:abce@test.org">abce@test.org</a> 
</p>

期望的输出:

<p><strong></strong><br><br><br><br><a></a></p>

我已经检查了一些正则表达式和宝石,但它们都提供了删除标签的解决方案。我已尝试使用tr,但这只是</>

任何帮助都非常感谢。

1 个答案:

答案 0 :(得分:1)

试试这个:

(<\/?\w+)(*SKIP)(*F)|[\w\s\.\:\-"'\=\@\,\;]+       // replace with ""(blank)  

  (<\/?\w+)(*SKIP)(*F)|[^<>]+

Live demo update demo