我正在尝试使用BeautifulSoup解码实体,但没有运气。
from BeautifulSoup import BeautifulSoup
decoded = BeautifulSoup("<p> </p>",convertEntities=BeautifulSoup.HTML_ENTITIES)
print decoded
根本不解码输出。我在这里找到了很多使用这种方法的答案。 我做错了吗?
我想使用BeautifulSoup,所以请不要打扰告诉我标准库有一个解码实体的方法。
答案 0 :(得分:2)
>>> print decoded
<p> </p>
>>> print decoded.contents
[u'<p> </p>']