遍历熊猫中的数据框行

时间:2019-09-14 07:44:46

标签: python pandas

遍历熊猫中的行并从行中获取对象列表

import pandas as pd;
df=pd.read_json("inputfile.txt")
                               data
0  {'M': {'1': 'data', '2': 'data2'}}
1    {'M': {'3': '555', '5': '3333'}}

data=[]
for row in df.iterrows():
    d = [{k1+k2:v2 for k1,v1 in x.items() for k2,v2 in v1.items()} for x in row]
    data.append(d)
print (data)

获得这样的输出

[[{'M1': 'data', 'M2': 'data2'}], [{'M3': '555', 'M5': '3333'}]]

需要这样的输出

[{'M1': 'data', 'M2': 'data2'}, {'M3': '555', 'M5': '3333'}]

2 个答案:

答案 0 :(得分:1)

这样做:

d = [{k1+k2:v2 for k1,v1 in x.items() for k2,v2 in v1.items()} for x in row]

您正在创建一个列表。并将其附加到data

修改后的代码:

import pandas as pd

df = pd.DataFrame({'data': [{'M': {'1': 'data', '2': 'data2'}}, {'M': {'3': '555', '5': '3333'}}]})
data = []
for row in df.iterrows():
    d = {k1+k2:v2 for x in row[1] for k1,v1 in x.items() for k2,v2 in v1.items()}
    data.append(d)
print(data)

答案 1 :(得分:1)

  • .extend()-通过将列表的所有项目(作为参数传递)添加到末尾来扩展列表。

例如。

import pandas as pd
data = {'data':[{'M': {'1': 'data', '2': 'data2'}},{'M': {'3': '555', '5': '3333'}}]}
df = pd.DataFrame(data)
print(df)
result=[]
for row in df.iterrows():
    x = [{"{0}{1}".format(k,k1) : v1 for k,v in x[1].items() for k1,v1 in v.items()} for x in row[1].items() ]
    result.extend(x)
print(result)

或单行列表理解

x = [{"{0}{1}".format(k,k1) : v1 for k,v in x[1].items() for k1,v1 in v.items()} for row in df.iterrows()
         for x in row[1].items() ]
print(x)

O / P:

                                 data
0  {'M': {'1': 'data', '2': 'data2'}}
1    {'M': {'3': '555', '5': '3333'}}


[{'M1': 'data', 'M2': 'data2'}, {'M3': '555', 'M5': '3333'}]
相关问题