我有一个完整的推文数据集,我通过Tweepy收集并将它们保存为json文件。现在我想根据我的需要在csv文件中转换该数据。仅限文本,用户名,创建时间和4-5个列。 我怎么能这样做任何人请为我提供一个python代码。另一个问题是,在转换csv中的数据时,我的推文文本也会在任何逗号出现时被拆分。 请帮助我们。我是这个领域的新人。 在此先感谢。
答案 0 :(得分:0)
您需要读取您的文件并从json格式转换每个非空行。然后,您可以使用itemgetter()
从生成的字典中提取所需的密钥,并将结果写入output.csv
文件:
from operator import itemgetter
import csv
import json
header = ['text', 'username', 'created_at']
required_cols = itemgetter(*header)
with open('python1.json') as f_input, open('output.csv', 'wb') as f_output:
csv_output = csv.writer(f_output)
csv_output.writerow(header)
for row in f_input:
if row.strip():
csv_output.writerow(required_cols(json.loads(row)))
如果您使用的是Python 3.x,请使用以下行:
with open('python1.json') as f_input, open('output.csv', 'w', newline='') as f_output: