是否有将HTML转换为纯文本的函数?

时间:2011-03-04 15:58:37

标签: java android html

是否有适用于Android的“hocus-pocus”功能,可将HTML转换为纯文本?

我指的是像Internet Explorer,Firefox等浏览器中的剪贴板转换操作一样的功能:如果您在浏览器中选择所有呈现的HTML并将其复制/粘贴到文本编辑器,您将收到(大部分)文本,没有任何HTML标签或标题。

在一个类似的线程中,我看到了对html2text的引用,但它是在Python中。我正在寻找Android / Java功能。

有没有这样的东西,或者我必须自己这样做,使用Jsoup还是Jtidy?

2 个答案:

答案 0 :(得分:19)

我会尝试类似的事情:

String html = "<b>hola</b>";
String plain = Html.fromHtml(html).toString();

答案 1 :(得分:0)

使用JSOUP:

String plain = new HtmlToPlainText().getPlainText(Jsoup.parse(html));

没有JSOUP:

String html= "htmltext";
String newHtml = html.replaceAll("(?s)<[^>]*>(\\s*<[^>]*>)*", " ").trim();