以json格式和特定​​时间范围从twitter收集数据

时间:2016-02-02 06:22:55

标签: python json time

此代码仅流数据。我想在3天的时间内提取数据。

import tweepy
from tweepy import OAuthHandler
from tweepy import Stream
from tweepy.streaming import StreamListener

# will pass key and token
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)

class TweetsListener( StreamListener ):

    def on_data(self, data):
        try:
            with open('name.json', 'a') as f:
                f.write(data)
                return True
        except BaseException as e:
            print("Error on_data: %s" % str(e))
        return True

    def on_error(self, status):
        print(status)
        return True

twitter_stream = Stream( auth, TweetsListener() ) 
twitter_stream.filter( track=['XX'] )

1 个答案:

答案 0 :(得分:0)

您正在使用Twitter Streaming API,该API用于捕获具有给定条件的未来推文(当发布具有给定搜索词的推文时调用on_data)。您需要使用Twitter REST API来搜索以前的数据。见tweepy.Search()

  

参数:

     

q - 搜索查询字符串

     

since_id - 仅返回   ID大于(即更近)的状态   指定的ID。