我想在Twitter上抓取10000条推文,包含带标签的特定单词。
例如,包含#标签,#love就像这样。并抓取推文中的所有主题标签。
例如,有一条推文就像这样存在。[我困了#boring #tired #sleep]
我希望抓取数据,并看到这样的结果。
"#镗" "#累" "#睡眠"
我希望能理解我在说什么。
我尝试使用twitter API为python抓取hashtag。
但有一些错误
我的代码在此之后:
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream
#Variables that contains the user credentials to access Twitter API
access_token = "mytoken"
access_token_secret = "mytokenscret"
consumer_key = "consumerkey"
consumer_secret = "consumersecret"
class StdOutListener(StreamListener):
def on_data(self, data):
print data
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['#happy'])
如何修复此问题,并抓取推文的所有主题标签,即推文包含特定主题标签。
我试过python 3.3.4和windows 8.1 64x。
请帮帮我。
感谢您阅读我的问题。
答案 0 :(得分:1)
由于您似乎使用的是Python 3.0+,因此无法使用print "Hello world"
,因此您需要使用print("Hello world")
,因此只需将打印调用更改为括号即可。