我正在尝试在python中创建一个应用程序(使用tweepy apis)来监听包含Emojis的推文。
我想检索包含表情符号的所有推文:'U + 1F603','\ xF0 \ x9F \ x98 \ x83'。
问题是尝试设置监听器来监听这些推文。
我正在使用Spyder和Python 2.7
#Set twitter stream
twitterStream = Stream(auth, listener())
twitterStream.filter(track=[tracker], languages = ["en"], stall_warnings = True, async=True)
这是我设置流的代码。这似乎适用于除表情符号之外的任何文本。
我试过了:
tracker = "\xF0\x9F\x98\x83"
tracker = "U+1F603"
我无法将表情符号粘贴到IDE中,因为它将其转换为字节,上面的代码将侦听文本(字节或unicode)而不是表情符号本身。
有人有任何建议吗?
答案 0 :(得分:5)
经过大量的研究,答案似乎很明显,所以我会发布它,包括其他人卡在一个类似的问题上。
问题在于如何处理unicode字符。虽然有些表情符号长5个字符,但需要更改。
stream.filter(track=[u"\u1F602"])
这需要更改为:
stream.filter(track=[u"\U0001F602"])
所以用'U000'替换'u'
我也忘了用U“\”
包围unicode