此代码在控制台上完美运行,但当我在我的烧瓶应用程序中实现它时,它表示那里有一个AttributeError
clean = html.unescape(tweet.text)
final = re.sub(r'\w+:\/{2}[\d\w-]+(\.[\d\w-]+)*(?:(?:\/[^\s/]*))*', '', clean)
我还在for循环中尝试了import html
和from html import unescape
答案 0 :(得分:5)
请注意,HTMLParser.unescape
自版本3.9.0a1起已从Python中删除。
答案 1 :(得分:4)
{3}}模块是在Python 3.4中引入的。如果您运行的是Python 2.7,则可能需要尝试使用HTMLParser.HTMLParser.unescape
。
答案 2 :(得分:2)
使用Python2构建烧瓶应用程序:
import HTMLParser
HTMLParser.HTMLParser().unescape('Hello & World')
答案 3 :(得分:0)
总结所有答案。如果您使用版本> 3.9的python,HTMLParser将无法正常工作。从py 3.4 html确实可以工作。 使用:
import html
如果您使用python <3.4(包括2.X),则html无效:
import HTMLParser
html = HTMLParser.HTMLParser()
如果您希望两者兼容:
import sys
if sys.version_info[0] > 3:
import html
else:
import HTMLParser
html = HTMLParser.HTMLParser()
html.unescape(my_string)