基本上我需要从文本中删除所有空段落。以下似乎不起作用......
String postLevel = content.replaceAll("<p>\\s*</p>", "");
有关为何的想法?
非ascii字符以某种方式进入字符串.....我删除了它们,这有效。 LOLZ
答案 0 :(得分:2)
我会尝试使用这个表达式:
<p>\\s*</p>|<p/>
这也会处理<p></p>
和<p/>
空段落。
答案 1 :(得分:0)
String s = "<p> </p>";
s = s.replaceAll("<p>\\s+</p>","");
System.out.println("Result: " + s);
输出:
结果:
我怀疑你的问题不是你输入的样子。你也会遇到这样一个问题:正则表达式在解析HTML方面非常糟糕,而且通常都是一种先发制人的尝试。