Question

嗨，我有这样的xml文本

<w:p> abc </w:p>
<w:p> def </w:p>
<w:tr #A1b2c3> <w:p> 123 </w:p> </w:tr>
<w:tr #C1d2e3> <w:p> 456 </w:p> </w:tr>
<w:p> ghi </w:p>

我需要提取所有类似abc的段落，除了像123这样的表行中的段落。有什么帮助吗？

Answer 1

那看起来不是有效的XML，因此正则表达式可能是您唯一的选择：

^<w:p>(.*?)<\/w:p>$

您可能希望找出是否存在用于该数据的解析器，因为显然存在某些系统必须使用该数据。