我想将一些元信息与Pandas DataFrame结合在一起作为JSON字符串。
我可以致电df.to_json(orient='values')
将DataFrame的数据作为数组,但如何将其与其他一些数据相结合?
result = {
meta: {'some': 'meta info'},
data: [[dataframe.values], [list], [...]]
}
我还可以问:如何将Python对象(meta: {...}
)合并为序列化的JSON字符串(df.to_json()
)?
答案 0 :(得分:2)
您始终可以将JSON转换为Python数据。
import json
df_json = df.to_json(orient='values') # JSON
py_data = json.loads( df_json ) # Python data
result['extra_data'] = py_data # merge data
json_all = json.dumps( result ) # JSON again
编辑:
我找到了更好的解决方案 - 使用pandas.json.dumps
标准模块json
在pandas制作的字典中使用的numpy数字存在问题。
import pandas as pd
result = { 'meta': {'some': 'meta info'} }
df = pd.DataFrame([[1,2,3], [.1,.2,.3]], columns=('a','b','c'))
#result['extra_data'] = df.to_dict() # as dictonary
result['extra_data'] = df
print pd.json.dumps( result )
结果
{
"extra_data":{
"a":{"0":1.0,"1":0.1},
"c":{"0":3.0,"1":0.3},
"b":{"0":2.0,"1":0.2}
},
"meta":{"some":"meta info"}
}
或
import pandas as pd
result = { 'meta': {'some': 'meta info'} }
df = pd.DataFrame([[1,2,3], [.1,.2,.3]], columns=('a','b','c'))
df_dict = df.to_dict()
df_dict['extra_data'] = result
print pd.json.dumps( df_dict )
结果
{
"a":{"0":1.0,"1":0.1},
"c":{"0":3.0,"1":0.3},
"b":{"0":2.0,"1":0.2}
"extra_data":{"meta":{"some":"meta info"}},
}