熊猫:在包含列表的一列中找到最大值

时间:2018-12-08 08:44:02

标签: python pandas dataframe

我有一个这样的数据框:

fly_frame:
          day    plcae
0  [1,2,3,4,5]       A
1    [1,2,3,4]       B
2        [1,2]       C
3     [1,2,3,4]      D

如果我想在“天”列的每个条目中找到最大值。

例如:

fly_frame:
          day    plcae
0           5       A
1           4       B
2           2       C
3           4       D

我该怎么办?
感谢您的帮助。

4 个答案:

答案 0 :(得分:3)

df.day.apply(max)
#0    5
#1    4
#2    2
#3    4

答案 1 :(得分:2)

applymax一起使用:

#if strings

#import ast

#print (type(df.loc[0, 'day']))
#<class 'str'>

#df['day'] = df['day'].apply(ast.literal_eval)

print (type(df.loc[0, 'day']))
<class 'list'>

df['day'] = df['day'].apply(max)

或列表理解:

df['day'] = [max(x) for x in df['day']]

print (df)
   day plcae
0    5     A
1    4     B
2    2     C
3    4     D

答案 2 :(得分:0)

我建议先将您的数据框改成更好的格式。

>>> df
               day plcae
0  [1, 2, 3, 4, 5]     A
1     [1, 2, 3, 4]     B
2           [1, 2]     C
3     [1, 2, 3, 4]     D
>>> 
>>> df = pd.concat([df.pop('day').apply(pd.Series), df], axis=1)
>>> df
     0    1    2    3    4 plcae
0  1.0  2.0  3.0  4.0  5.0     A
1  1.0  2.0  3.0  4.0  NaN     B
2  1.0  2.0  NaN  NaN  NaN     C
3  1.0  2.0  3.0  4.0  NaN     D

现在,一切都变得更加容易,例如计算列中的最大值。

>>> df.max(axis=1)
0    5.0
1    4.0
2    2.0
3    4.0
dtype: float64

编辑:重命名索引可能对您也有用。

>>> df.max(axis=1).rename(df['plcae'])
A    5.0
B    4.0
C    2.0
D    4.0
dtype: float64

答案 3 :(得分:0)

尝试将pd.concat()df.apply()结合使用:

import numpy as np
import pandas as pd


fly_frame = pd.DataFrame({'day':[[1,2,3,4,5],[1,2,3,4],[1,2],[1,2,3,4]],'place':['A','B','C','D']})

df = pd.concat([fly_frame['day'].apply(max),fly_frame.drop('day',axis=1)],axis=1)

print(df)



   day place
0    5     A
1    4     B
2    2     C
3    4     D

修改 您还可以将df.join()用于:

fly_frame.drop('day',axis=1).join(fly_frame['day'].apply(np.max,axis=0))


place  day
0     A    5
1     B    4
2     C    2
3     D    4