使用Unicode字符/ Apple Emoji搜索推文?

时间:2013-03-23 17:01:43

标签: twitter

我正在编辑推文的语料库以进行情绪分析,并尝试使用Apple Emoji字符抓取推文。

我发现其中一个面的unicode字符为:U + 1F604(U + D83D U + DE04),UTF-8:F0 9F 98 84

到目前为止,我还没有得到任何有意义的结果。如果我搜索\ud83d\ude04我会收到一些推文,但没什么用处。 \U0001f604在搜索时不返回任何内容。

我有什么方法可以在Twitter上查询这些字符吗?

我正在使用API​​的python-twitter包装器,但如果存在更好的替代方案,我愿意使用其他东西。

2 个答案:

答案 0 :(得分:5)

正如@Terence Eden指出的那样,twitters REST搜索api不能使用表情符号字符,但是流媒体API确实如此(截至2016年1月)。

有一些工具用于访问python中的twitters API。我经常使用的那个tweepy。它可以与pip一起安装。

tweepy docs on setting up the streaming api非常容易理解。您过滤的字符串需要包含实际的表情符号字符(例如:'')。

请注意,这会将表情符号搜索为"单词":即被空格包围。喜欢"免费"找不到了!

答案 1 :(得分:3)

这是可能的 - 但它有点棘手......

您无法使用标准Twitter搜索 - 但您可以使用流式搜索。

Ruby和Node中的https://github.com/mroth/emojitrack-feeder提供了开源库。