Pandas DataFrame到词典列表

时间:2015-04-23 06:12:18

标签: python list dictionary pandas dataframe

我有以下DataFrame:

customer    item1      item2    item3
1           apple      milk     tomato
2           water      orange   potato
3           juice      mango    chips

我想把它翻译成每行的词典列表

rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
    {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
    {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

5 个答案:

答案 0 :(得分:148)

使用Solr's wiki - 无需在外部转置即可提供输出。

In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

答案 1 :(得分:106)

修改

正如约翰高尔特在his answer 中提到的那样,你应该改为使用mysql_query( "INSERT INTO users(email, password) VALUES ('$email','$password')" ); $user_id = mysql_insert_id( ); mysql_query( "INSERT INTO business_details ( business_id, name, address, city, state, country, pincode) VALUES ('$category','$business_name', '$business_address', '$city', '$state', '$country', '$pincode')" ); $idB = mysql_insert_id( ); mysql_query( "INSERT INTO user_profiles (name, phone, user_id, business_details_id) VALUES ('$person_name', '$phone_number', '$user_id', '$idB')" ); 。它比手动转置更快。

df.to_dict('records')

原始答案

使用In [20]: timeit df.T.to_dict().values() 1000 loops, best of 3: 395 µs per loop In [21]: timeit df.to_dict('records') 10000 loops, best of 3: 53 µs per loop ,如下所示:

df.T.to_dict().values()

答案 2 :(得分:7)

作为John Galt's回答的延伸 -

对于以下DataFrame,

   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

如果您想获得包含索引值的词典列表,您可以执行类似的操作,

df.to_dict('index')

其中输出字典字典,其中父字典的键是索引值。在这种特殊情况下,

{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}

答案 3 :(得分:2)

如果您只想选择一列,这将起作用。

df[["item1"]].to_dict("records")

以下内容将起作用,并产生TypeError:不支持的类型:。我相信这是因为它正在尝试将系列转换为字典,而不是将数据框架转换为字典。

df["item1"].to_dict("records")

我只需要选择一个列,然后将其转换为以列名作为键的字典列表,并在此卡了一段时间,以至于我想与之分享。

答案 4 :(得分:0)

你也可以遍历行:

rows = []
for index, row in df[['customer', 'item1', 'item2', 'item3']].iterrows():
    rows.append({
            'customer': row['customer'],
            'item1': row['item1'],
            'item2': row['item2'],
            'item3': row['item3'],
            })