应用错误收集

以json格式和特定时间范围从twitter收集数据

时间：2016-02-02 06:22:55

标签： python json time

此代码仅流数据。我想在3天的时间内提取数据。

import tweepy
from tweepy import OAuthHandler
from tweepy import Stream
from tweepy.streaming import StreamListener

# will pass key and token
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)

class TweetsListener( StreamListener ):

    def on_data(self, data):
        try:
            with open('name.json', 'a') as f:
                f.write(data)
                return True
        except BaseException as e:
            print("Error on_data: %s" % str(e))
        return True

    def on_error(self, status):
        print(status)
        return True

twitter_stream = Stream( auth, TweetsListener() ) 
twitter_stream.filter( track=['XX'] )

1 个答案:

答案 0 :(得分：0)

您正在使用Twitter Streaming API，该API用于捕获具有给定条件的未来推文（当发布具有给定搜索词的推文时调用on_data）。您需要使用Twitter REST API来搜索以前的数据。见tweepy.Search()

参数：

q - 搜索查询字符串

since_id - 仅返回   ID大于（即更近）的状态   指定的ID。