使用java.util.regex的HTML正则表达式

时间:2010-07-16 17:34:29

标签: java html regex

我需要一个正则表达式来跟随html:

<div xmlns="http://www.w3.org/1999/xhtml">    <p/>
  <p/><p/>    <p/>
</div>

这是一个richtext字段,显然这不是有意义的内容或意味着:空。 我不能在java中说:if(richTextConent == null || richTextContent.length == 0)因为richtext字段包含一些东西。从语义上讲,上面的内容是空的,所以我想到了使用正则表达式。我需要将此代码段与java.util.regex

匹配

如果代码段中有一些有意义的内容,请执行以下操作:

<div xmlns="http://www.w3.org/1999/xhtml"> text<p/>
  <p/><p/>text    <p/>
</div>

比正则表达式不匹配。

1 个答案:

答案 0 :(得分:3)

使用像Jsoup这样的HTML解析器。

String html1 = "<div xmlns=\"http://www.w3.org/1999/xhtml\">    <p/>  <p/><p/>    <p/></div>";
String html2 = "<div xmlns=\"http://www.w3.org/1999/xhtml\"> text<p/>        <p/><p/>text    <p/>        </div>";

System.out.println(Jsoup.parse(html1).text().isEmpty()); // true
System.out.println(Jsoup.parse(html2).text().isEmpty()); // false

另见: