我正在尝试读取从tweeterAPI删除的高音扬声器数据的整个文本块。文本数据如下:
{“贡献者”:null,“坐标”:null,“ created_at”:“ Thu Jun 07 14:57:00 +0000 2018”,“ entities”:{“ hashtags”:[],“ symbols”: [],“网址”:[{“ display_url”:“ twitter.com/i/web/status/1\u2026”、“expanded_url”:“https://twitter.com/i/web/status/1004739005676695552”,“指标”:[111、134] ,“ url”:“ https://xxxx”}],“ user_mentions”:[]},“ favorite_count”:0,“ favorited”:false,“ geo”:null,“ id”:1004739005676695552,“ id_str” :“ 1004739005676695552”,“ in_reply_to_screen_name”:null,“ in_reply_to_status_id”:null,“ in_reply_to_status_id_str”:null,“ in_reply_to_user_id”:null,“ in_reply_to_user_id_str”:null,“是”元数据”:{“ iso_language_code”:“ es”,“ result_type”:“ recent”} ...
其中的图案重复
我想在python 3中使用json库解析每个tweet,但是遇到了 JSONDecodeError错误:期望值:第1行第1列(字符0)。
我相信“行”已经被解码了,因为它是字符串类型,但是我无法绕过头来调试它。我将不胜感激,谢谢您。
all_scrapped_tweets = []
with open(my_text_file, 'r') as f:
for line in f:
twt = json.loads(line)
all_scrapped_tweets.append(twt)
答案 0 :(得分:0)
您在...之前的样本缺少最后的}以关闭json。如您在注释中所示,您的数据似乎已损坏。