使用python的api抓取使用api的hashtag标签

时间:2016-06-14 06:19:00

标签: python twitter tweepy hashtag

我想在Twitter上抓取10000条推文,包含带标签的特定单词。

例如,包含#标签,#love就像这样。

并抓取推文中的所有主题标签。

例如,有一条推文就像这样存在。

[我困了#boring #tired #sleep]

我希望抓取数据,并看到这样的结果。

"#镗" "#累" "#睡眠"

我希望能理解我在说什么。

我尝试使用twitter API为python抓取hashtag。

但有一些错误

我的代码在此之后:

from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream

#Variables that contains the user credentials to access Twitter API 
access_token = "mytoken"
access_token_secret = "mytokenscret"
consumer_key = "consumerkey"
consumer_secret = "consumersecret"

class StdOutListener(StreamListener):

    def on_data(self, data):
        print data
        return True

    def on_error(self, status):
        print status


if __name__ == '__main__':

    l = StdOutListener()
    auth = OAuthHandler(consumer_key, consumer_secret)
    auth.set_access_token(access_token, access_token_secret)
    stream = Stream(auth, l)
    stream.filter(track=['#happy'])

当我运行此代码时,会出现这样的弹出窗口。 enter image description here

如何修复此问题,并抓取推文的所有主题标签,即推文包含特定主题标签。

我试过python 3.3.4和windows 8.1 64x。

请帮帮我。

感谢您阅读我的问题。

1 个答案:

答案 0 :(得分:1)

由于您似乎使用的是Python 3.0+,因此无法使用print "Hello world",因此您需要使用print("Hello world"),因此只需将打印调用更改为括号即可。