从HTML替换不起作用

时间:2013-12-31 18:58:55

标签: java html jsoup

我正在尝试删除html元素文本的额外空间,但它不起作用。 原始的html元素是:

<td class="thinborder" >&nbsp;text</td>

如果我将使用Jsoup使用element.text()访问此文件,则返回:

" text"

以下是我使用的方法,但所有这些方法都不起作用:

String fixed = element.text().replace(" ", "");
String fixed = element.text().replace("nbsp;", "");
String fixed = element.text().replaceFirst(" ", "");

编辑: *修剪也不起作用

1 个答案:

答案 0 :(得分:4)

只需trim()字符串

String fixed = element.text().trim();
  

返回字符串的副本,省略前导和尾随空格。

还试试正则表达式

String result =  element.text().replaceAll("\\s+","");

如果您仍然无法使其工作,请尝试替换unicode空间

String result =  element.text().replace("\u00A0","");