我正在编辑推文的语料库以进行情绪分析,并尝试使用Apple Emoji字符抓取推文。
我发现其中一个面的unicode字符为:U + 1F604(U + D83D U + DE04),UTF-8:F0 9F 98 84
到目前为止,我还没有得到任何有意义的结果。如果我搜索\ud83d\ude04
我会收到一些推文,但没什么用处。 \U0001f604
在搜索时不返回任何内容。
我有什么方法可以在Twitter上查询这些字符吗?
我正在使用API的python-twitter包装器,但如果存在更好的替代方案,我愿意使用其他东西。
答案 0 :(得分:5)
正如@Terence Eden指出的那样,twitters REST搜索api不能使用表情符号字符,但是流媒体API确实如此(截至2016年1月)。
有一些工具用于访问python中的twitters API。我经常使用的那个tweepy
。它可以与pip
一起安装。
tweepy docs on setting up the streaming api非常容易理解。您过滤的字符串需要包含实际的表情符号字符(例如:'')。
请注意,这会将表情符号搜索为"单词":即被空格包围。喜欢"免费"找不到了!
答案 1 :(得分:3)
这是可能的 - 但它有点棘手......
您无法使用标准Twitter搜索 - 但您可以使用流式搜索。
Ruby和Node中的https://github.com/mroth/emojitrack-feeder提供了开源库。