Question

我正在尝试读取从tweeterAPI删除的高音扬声器数据的整个文本块。文本数据如下：

{“贡献者”：null，“坐标”：null，“ created_at”：“ Thu Jun 07 14:57:00 +0000 2018”，“ entities”：{“ hashtags”：[]，“ symbols”： []，“网址”：[{“ display_url”：“ twitter.com/i/web/status/1\u2026”、“expanded_url”：“https://twitter.com/i/web/status/1004739005676695552”，“指标”：[111、134] ，“ url”：“ https://xxxx”}]，“ user_mentions”：[]}，“ favorite_count”：0，“ favorited”：false，“ geo”：null，“ id”：1004739005676695552，“ id_str” ：“ 1004739005676695552”，“ in_reply_to_screen_name”：null，“ in_reply_to_status_id”：null，“ in_reply_to_status_id_str”：null，“ in_reply_to_user_id”：null，“ in_reply_to_user_id_str”：null，“是”元数据”：{“ iso_language_code”：“ es”，“ result_type”：“ recent”} ...

其中的图案重复

我想在python 3中使用json库解析每个tweet，但是遇到了 JSONDecodeError错误：期望值：第1行第1列（字符0）。

我相信“行”已经被解码了，因为它是字符串类型，但是我无法绕过头来调试它。我将不胜感激，谢谢您。

all_scrapped_tweets = []
with open(my_text_file, 'r') as f:
for line in f:
    twt = json.loads(line)
    all_scrapped_tweets.append(twt)

Answer 1

您在...之前的样本缺少最后的}以关闭json。如您在注释中所示，您的数据似乎已损坏。

JSONDecodeError：预期值行1的列1（字符0）

1 个答案: