我使用这个基于tweepy的code通过user_id拉取给定用户的推文。然后,我将给定用户的所有推文(alltweets)列表保存到json文件,如下所示。请注意,如果没有“repr”,我无法将alltweets列表转储到json文件中。代码按预期工作
with open(os.path.join(output_file_path,'%s_tweets.json' % user_id), 'a') as f:
json.dump(repr(alltweets), f)
但是,在将推文保存到json文件后检索推文时遇到了问题。我需要访问每条推文中的文本,但我不知道如何处理tweepy使用的“Status”包装器(请参阅附带的json文件示例)。sample json file content
我尝试按如下方式迭代文件中的行,但文件被视为一行。
with open(fname, 'r') as f:
for line in f:
tweet = json.loads(line)
我也尝试在将json文件作为字符串读取之后迭代状态,如下所示,但迭代发生在json文件中的各个字符上。
with open(fname, 'r') as f:
x = f.read()
for status in x:
"""code"""
答案 0 :(得分:0)
也许不是最漂亮的解决方案,但您可以将Status
声明为dict
,然后eval
列表(文件的整个内容)。
Status = dict
f = open(fname, 'r')
data = eval(f.read())
f.close()
for status in data:
""" do your stuff"""