仅从java中的url获取编码的html内容

时间:2011-03-29 16:13:33

标签: java html encode jsoup

JAVA中是否有可以编码HTML的库,但只有内容?

我喜欢

<div>Tél</div>

我只想要

<div>T&eacute;l</div>

而不是

&lt;div&gt;T&eacute;l<&lt;/div&gt;

我需要这个库来编码整个HTML。 我尝试过库JSoup,但在处理一些对象时会出现bug。

由于

1 个答案:

答案 0 :(得分:1)

使用正则表达式解析HTML绝不是一个好主意,这是灾难的一种方法。

首先看一下这个Q&amp; A,用于java中的HTML解析:Java HTML Parsing

一旦您能够解析HTML并获取内部HTML文本,您就可以通过以下方式之一对HTML进行编码:Is there a JDK class to do HTML encoding (but not URL encoding)?