Question

此代码在控制台上完美运行，但当我在我的烧瓶应用程序中实现它时，它表示那里有一个AttributeError

        clean = html.unescape(tweet.text)

        final = re.sub(r'\w+:\/{2}[\d\w-]+(\.[\d\w-]+)*(?:(?:\/[^\s/]*))*', '', clean)

我还在for循环中尝试了import html

和from html import unescape

Answer 1

请注意，HTMLParser.unescape自版本3.9.0a1起已从Python中删除。

Answer 2

{3}}模块是在Python 3.4中引入的。如果您运行的是Python 2.7，则可能需要尝试使用HTMLParser.HTMLParser.unescape。

Answer 3

使用Python2构建烧瓶应用程序：

import HTMLParser
HTMLParser.HTMLParser().unescape('Hello &amp; World')

Answer 4

总结所有答案。如果您使用版本> 3.9的python，HTMLParser将无法正常工作。从py 3.4 html确实可以工作。使用：

import html

如果您使用python <3.4（包括2.X），则html无效：

import HTMLParser
html = HTMLParser.HTMLParser()

如果您希望两者兼容：

import sys
if sys.version_info[0] > 3:
  import html

else:
  import HTMLParser
  html = HTMLParser.HTMLParser()

html.unescape(my_string)