将DataFrame作为JSON与其他数据相结合

时间:2014-07-06 07:35:19

标签: python json pandas

我想将一些元信息与Pandas DataFrame结合在一起作为JSON字符串。

我可以致电df.to_json(orient='values')将DataFrame的数据作为数组,但如何将其与其他一些数据相结合?

result = {
  meta: {'some': 'meta info'},
  data: [[dataframe.values], [list], [...]]
}

我还可以问:如何将Python对象(meta: {...})合并为序列化的JSON字符串(df.to_json())?

1 个答案:

答案 0 :(得分:2)

您始终可以将JSON转换为Python数据。

import json

df_json = df.to_json(orient='values') # JSON

py_data = json.loads( df_json ) # Python data

result['extra_data'] = py_data # merge data

json_all = json.dumps( result ) # JSON again

编辑:

我找到了更好的解决方案 - 使用pandas.json.dumps
标准模块json在pandas制作的字典中使用的numpy数字存在问题。

import pandas as pd

result = { 'meta': {'some': 'meta info'} }

df = pd.DataFrame([[1,2,3], [.1,.2,.3]], columns=('a','b','c'))

#result['extra_data'] = df.to_dict() # as dictonary

result['extra_data'] = df 

print pd.json.dumps( result )

结果

{
  "extra_data":{
      "a":{"0":1.0,"1":0.1},
      "c":{"0":3.0,"1":0.3},
      "b":{"0":2.0,"1":0.2}
  },
  "meta":{"some":"meta info"}
}

import pandas as pd

result = { 'meta': {'some': 'meta info'} }

df = pd.DataFrame([[1,2,3], [.1,.2,.3]], columns=('a','b','c'))

df_dict = df.to_dict()

df_dict['extra_data'] = result

print pd.json.dumps( df_dict )

结果

{
   "a":{"0":1.0,"1":0.1},
   "c":{"0":3.0,"1":0.3},
   "b":{"0":2.0,"1":0.2}
   "extra_data":{"meta":{"some":"meta info"}},
}