我有一系列的.json文件。每个文件都包含基于不同关键字的推文。每个文件中的每一行都是一个json对象。我使用以下代码读取文件:
# Get tweets out of JSON file
tweetsFromJSON = []
with open(json_file) as f:
for line in f:
json_object = json.loads(line)
tweet_text = json_object["text"]
tweetsFromJSON.append(tweet_text)
对于每个JSON文件,我都能完美无缺地运行。但this特定文件给出了以下错误:
Traceback (most recent call last):
File "C:/Users/alexandros/Dropbox/Development/Sentiment Analysis/lda_analysis.py", line 119, in <module>
lda_analysis('precision_medicine.json', 'precision medicine')
File "C:/Users/alexandros/Dropbox/Development/Sentiment Analysis/lda_analysis.py", line 46, in lda_analysis
json_object = json.loads(line)
File "C:\Users\alexandros\AppData\Local\Programs\Python\Python35-32\lib\json\__init__.py", line 319, in loads
return _default_decoder.decode(s)
File "C:\Users\alexandros\AppData\Local\Programs\Python\Python35-32\lib\json\decoder.py", line 342, in decode
raise JSONDecodeError("Extra data", s, end)
json.decoder.JSONDecodeError: Extra data: line 1 column 5287 (char 5286)
所以尝试删除第一行以查看会发生什么。错误仍然存在,并且它又处于完全相同的位置(第1行第5287行(字符5286))。我删除了另一条线,它是一样的。我试图弄清楚出了什么问题。我错过了什么?