使用正则表达式<table> </table>匹配结束标记

时间:2013-09-05 11:18:01

标签: xml regex

我需要在xml数据字典文件中找到<table>标签。标准是表元素必须包含单词taxTax

为此,我尝试匹配结束的html table标记。

<table\b[^>]*>(.*?)</table><table[^>]*>[^(<\/table>)]*但它无效。

我发现解析xml时我们必须使用XML Parser而不是正则表达式。但是到目前为止我对正则表达式非常满意,所以这次我想用正则表达式完成它。

1 个答案:

答案 0 :(得分:3)

使用DOM XML PARSER并使用getElementsByTagName()函数匹配表标记和getTextContent()以获取标记的内容以匹配单词 tax Tax 。请不要使用正则表达式,因为使用正则表达式解析XML是一种不好的做法。

有关简单教程,请参阅:http://www.mkyong.com/java/how-to-read-xml-file-in-java-dom-parser/