Java - 使用JRE系统库删除所有HTML标记

时间:2015-02-18 10:18:36

标签: java html string

我必须从Java中的字符串中删除所有html标记。

使用JRE系统库有没有简单的方法呢?

为了确保您理解,环顾四周,我发现了很多建议,框架(JsouphtmlcleanerhtmlparserApache Tika等等),正则表达式或小代码片段。

我可以在不引入依赖关系或处理潜在错误代码的情况下执行此操作吗?

1 个答案:

答案 0 :(得分:0)

我在这个网站上找到了答案:

String noHTMLString = htmlString.replaceAll("\\<.*?\\>", "");

请参阅Stripping HTML tags in Java