从json文件中的“Status”包装器中解析推文的文本

时间:2016-08-22 04:06:50

标签: python tweepy

我使用这个基于tweepy的code通过user_id拉取给定用户的推文。然后,我将给定用户的所有推文(alltweets)列表保存到json文件,如下所示。请注意,如果没有“repr”,我无法将alltweets列表转储到json文件中。代码按预期工作

with open(os.path.join(output_file_path,'%s_tweets.json' % user_id), 'a') as f:
     json.dump(repr(alltweets), f)

但是,在将推文保存到json文件后检索推文时遇到了问题。我需要访问每条推文中的文本,但我不知道如何处理tweepy使用的“Status”包装器(请参阅附带的json文件示例)。sample json file content

我尝试按如下方式迭代文件中的行,但文件被视为一行。

with open(fname, 'r') as f: 
     for line in f: 
        tweet = json.loads(line)

我也尝试在将json文件作为字符串读取之后迭代状态,如下所示,但迭代发生在json文件中的各个字符上。

with open(fname, 'r') as f: 
     x = f.read() 
          for status in x: 
               """code"""

1 个答案:

答案 0 :(得分:0)

也许不是最漂亮的解决方案,但您可以将Status声明为dict,然后eval列表(文件的整个内容)。

Status = dict

f = open(fname, 'r')
data = eval(f.read())
f.close()

for status in data:
    """ do your stuff"""