以JSON格式获取Tweepy搜索结果

时间:2014-06-02 20:15:47

标签: python json twitter tweepy

我想使用Tweepy作为JSON从Twitter获得搜索结果。 我看到here我应该为Tweepy代码添加一个类来使这个功能起作用。

但是当我看到Tweepy代码时,这就是我得到的:

class JSONParser(Parser):

    payload_format = 'json'

    def __init__(self):
        self.json_lib = import_simplejson()

    def parse(self, method, payload):
        try:
            json = self.json_lib.loads(payload)
        except Exception, e:
            raise TweepError('Failed to parse JSON payload: %s' % e)

        needsCursors = method.parameters.has_key('cursor')
        if needsCursors and isinstance(json, dict) and 'previous_cursor' in json and 'next_cursor' in json:
            cursors = json['previous_cursor'], json['next_cursor']
            return json, cursors
        else:
            return json

    def parse_error(self, payload):
        error = self.json_lib.loads(payload)
        if error.has_key('error'):
            return error['error']
        else:
            return error['errors']

所以我没有义务破解它的代码,因为功能已经存在。

这是我的代码的外观:

from tweepy.parsers import JSONParser
for tweet in tweepy.Cursor(api.search,
                       q=hashtag,
                       include_entities=True,
                       rpp=100,
                       parser=tweepy.parsers.JSONParser()
                       ).items(limit):

这是我得到的错误:

   print (json.dumps(tweet))
  File "/usr/lib/python2.7/json/__init__.py", line 243, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 207, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 270, in iterencode
    return _iterencode(o, 0)
  File "/usr/lib/python2.7/json/encoder.py", line 184, in default
    raise TypeError(repr(o) + " is not JSON serializable")
TypeError: <tweepy.models.Status object at 0xb6df2fcc> is not JSON serializable

我应该从这个错误中解脱出什么?我该如何解决?

2 个答案:

答案 0 :(得分:6)

如果你像这样使用光标

import json
api = tweepy.API(auth)
max_tweets=100
query='Ipython'
searched_tweets = [status._json for status in tweepy.Cursor(api.search,  q=query).items(max_tweets)]
json_strings = [json.dumps(json_obj) for json_obj in searched_tweets]  

searched_tweets是JSON对象列表,而json_strings是JSON字符串列表

答案 1 :(得分:5)

如果你可以在没有Cursor的情况下工作,你可以使用JSONParser。但如果你能处理分页,你可以这样做:

>>> api = tweepy.API(auth, parser=tweepy.parsers.JSONParser())

确保将rpp更改为count,因为rpp在Twitter Search API中已过时

>>> results = api.search(q="IPython", count=100)

您将以原始格式获得结果。意思是你将获得一个带有两个键的词典

>>> results.keys()
[u'search_metadata', u'statuses']

您可以从&#34;状态&#34;获取搜索结果值。

>>> results["statuses"]
[{u'contributors': None,
  u'coordinates': None,
  u'created_at': u'Wed Oct 15 03:36:08 +0000 2014',
  ....