我收到了一个格式为
的文件 {"A":1, "B":2, "D":3}
{"C":1, "E":5, "F":3}
{"A":4, "C":5, "F":3}
因此文件的每一行都是一个json对象,它的键可以是ABCDEF
中任意大小为3的子集,我现在想要实现的是解析文件中的稀疏矩阵,我填充在该行中不存在密钥的每一行中的NA。
我使用Python和包json
逐行解析文件,但肯定不那么整洁有效,所以对此任务有什么建议吗?
答案 0 :(得分:1)
我不确定这是否最有效,但确实很容易:
import pandas as pd
json_string = '[{"A":1, "B":2, "D":3},{"C":1, "E":5, "F":3},{"A":4, "C":5, "F":3}]'
df = pd.read_json(json_string)
print(df)
给出:
A B C D E F
0 1.0 2.0 NaN 3.0 NaN NaN
1 NaN NaN 1.0 NaN 5.0 3.0
2 4.0 NaN 5.0 NaN NaN 3.0