使用BeautifulSoup解码html实体

时间:2012-04-10 11:56:36

标签: python beautifulsoup

我正在尝试使用BeautifulSoup解码实体,但没有运气。

from BeautifulSoup import BeautifulSoup

decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES)

print decoded

根本不解码输出。我在这里找到了很多使用这种方法的答案。 我做错了吗?

我想使用BeautifulSoup,所以请不要打扰告诉我标准库有一个解码实体的方法。

1 个答案:

答案 0 :(得分:2)

您需要print decoded.contents

>>> print decoded
<p> </p>
>>> print decoded.contents
[u'<p> </p>']