说我有以下HTML表情符号实体:'😄'
请注意,4和之间实际上没有空格。它只是在那里,所以它不会显示为笑脸
表情符号的Python表单是:你" \ U0001f604"
如何将所有HTML表情符号实体转换为其Python表单?
到目前为止我尝试过的事情:
答案 0 :(得分:3)
HTMLParser.unescape
就是这样做的:
In [3]: HTMLParser.HTMLParser().unescape( '😄' )
Out[3]: u'\U0001f604'