替换html标签

时间:2014-09-10 08:19:58

标签: java regex

我有一个看起来像这样的字符串:

<ul>;<li>java</li>;<li>angular</li>;<li>python</li>;

我想替换所有的html标签。

我试过了:

    file1 = file1.replaceAll("<TAG\b[^>]*>(.*?)</TAG>", "");

然而,这让我回来了:

file1 = file1.replaceAll("<TAG\b[^>]*>(.*?)</TAG>", "");

我非常感谢你的回复!

2 个答案:

答案 0 :(得分:3)

你可以试试这个

file1 = file1.replaceAll("<[^>]*>","");

<强> REGEX DEMO

旁注:

如果您可以使用JSoup,那么对您来说这将是一个简单的伎俩。像

这样的东西
Jsoup.parse(yourhtml).text();

答案 1 :(得分:1)

 <[^>]*>|<[^>\/]\/>

试试这个。看演示。

http://regex101.com/r/nG1gU7/31