RegExKitLite匹配HTML标记并提取文本

时间:2010-01-14 04:46:27

标签: macos regexkitlite

如何使用RegExKitLite匹配HTML标记并提取文本? 即:

<li color=red>
<span>1</span>
<span>2</span>
</li>

如何在<li> </li>之间获取内容?

1 个答案:

答案 0 :(得分:2)

使用正则表达式来解析HTML通常被认为是不好的形式 - 您是否考虑过使用LXML / HTML解析库? 见这里:RegEx match open tags except XHTML self-contained tags