嗨,我有这样的xml文本
<w:p> abc </w:p>
<w:p> def </w:p>
<w:tr #A1b2c3> <w:p> 123 </w:p> </w:tr>
<w:tr #C1d2e3> <w:p> 456 </w:p> </w:tr>
<w:p> ghi </w:p>
我需要提取所有类似abc的段落,除了像123这样的表行中的段落。有什么帮助吗?
答案 0 :(得分:0)
那看起来不是有效的XML,因此正则表达式可能是您唯一的选择:
^<w:p>(.*?)<\/w:p>$
https://regex101.com/r/QsS3tW/1
您可能希望找出是否存在用于该数据的解析器,因为显然存在某些系统必须使用该数据。