删除标签后的所有空格

时间:2012-12-10 15:42:04

标签: java html replace whitespace

我需要删除字符串中<br />之后的所有空格。我从xml文档中获取了一些html文本,我在这个代码的Android应用程序中讨厌:

information_view.setText(Html.fromHtml(information));

问题是这个HTML代码:

&nbsp;

 Betsson vill att du ska vinna jackpotten p&aring; &ouml;ver 90 miljoner !<br />
 D&auml;rf&ouml;r &nbsp;f&aring;r du&nbsp;5 free spins&nbsp;p&aring;&nbsp;Mega fortune&nbsp;varje dag fram tills jackpotten har g&aring;tt till en lycklig vinnare.&nbsp;<br />
 <br />
 Regler och Villkor:<br />
 Bonuspengar m&aring;ste oms&auml;ttas 35 g&aring;nger innan uttag.<br />
 &nbsp;

在应用中打印时看起来像这样:

    Betsson vill att du ska vinna
jackpotten på över 90 miljoner !
    Därför får du 5 free spins på Mega
Fortune varje dag fram tills jackpotten
har gått ut till en lycklig vinnare.

    Regler och villkor:
    Bonuspengarna måste omsättas 35
gånger innan uttag.

正如您所见,html代码中出现&nbsp;" "个空格。但是替换其中一个就足够了,因为我可以用&nbsp;替换" "或反过来。

我已经尝试过几天了,所有的帮助都非常感谢。

1 个答案:

答案 0 :(得分:4)

String html = ...
// replace your &nbsp;
html = html.replaceAll("<br />\\s+", "<br />");

但我更喜欢使用像HTMLoup这样的HTML解析器来解析HTML。

正如@Christoph指出的那样,你也可以使用它:

html = html.replaceAll("<br />\\p{Space}+", "<br />");