标签: macos regexkitlite
如何使用RegExKitLite匹配HTML标记并提取文本? 即:
<li color=red> <span>1</span> <span>2</span> </li>
如何在<li> </li>之间获取内容?
<li> </li>
答案 0 :(得分:2)
使用正则表达式来解析HTML通常被认为是不好的形式 - 您是否考虑过使用LXML / HTML解析库? 见这里:RegEx match open tags except XHTML self-contained tags