将文本文件中的Tweet字符串转换为Python中的JSON对象

时间:2016-03-31 04:06:00

标签: python json twitter

以下是我存储在名为txt的{​​{1}}文件中的示例字符串:

file.txt

此数据与推文有关,每条推文都在文本文件的新行上。

现在我使用以下代码将其加载到python中:

{
    "created_at":"Wed Mar 30 23:13:12 +0000 2013",
    "id":3712307838977,
    "id_str":"12307838977",
    "timestamp_ms":"7392180”
}

这为我提供了每条推文的字符串列表。我想将它转换为json对象,所以我可以做类似的事情:

with open(test_file, 'r') as f:
    data = f.read().split('\n')

但是,在尝试使用for tweet in data: created = tweet["created_at'] 时,我遇到了许多不同类型的错误。任何帮助?

1 个答案:

答案 0 :(得分:0)

您最有可能发生的问题是因为字符串的这一部分:

"timestamp_ms":"7392180”

更具体地说,最后一个引用

您最有可能收到此错误:

json.decoder.JSONDecodeError: Unterminated string starting at: line 1 column 105 (char 104)

我不知道您是如何生成此文件的,但通过修复并使用此双引号",转换可以正常工作。

import json

with open('new_file.txt', 'r') as f:
    json_data = json.loads(f.read().strip())


for data in json_data:
    print(json_data[data])

输出:

3712307838977
12307838977
7392180
Wed Mar 30 23:13:12 +0000 2013