Java正则表达式删除空段落

时间:2012-02-18 05:05:44

标签: java regex

基本上我需要从文本中删除所有空段落。以下似乎不起作用......

String postLevel = content.replaceAll("<p>\\s*</p>", "");

有关为何的想法?

非ascii字符以某种方式进入字符串.....我删除了它们,这有效。 LOLZ

2 个答案:

答案 0 :(得分:2)

我会尝试使用这个表达式:

<p>\\s*</p>|<p/>

这也会处理<p></p><p/>空段落。

答案 1 :(得分:0)

String s = "<p> </p>";
s = s.replaceAll("<p>\\s+</p>","");
System.out.println("Result: " + s);

输出:

  

结果:

我怀疑你的问题不是你输入的样子。你也会遇到这样一个问题:正则表达式在解析HTML方面非常糟糕,而且通常都是一种先发制人的尝试。