如何在数据框列中找到数组中的最大值?

时间:2018-04-17 17:43:51

标签: python pandas

我有一个如下所示的数据框(df):

a                      b
loc.1  [1, 2, 3, 4, 7, 5, 6]
loc.2  [3, 4, 3, 7, 7, 8, 6]
loc.3  [1, 4, 3, 1, 7, 8, 6]
...

我想找到b列中数组的最大值,并将其附加到原始数据框。我的想法是这样的:

for line in df: 
    split = map(float,b.split(','))
    count_max = max(split)
print count

理想的输出应该是:

a                      b           max_val
    loc.1  [1, 2, 3, 4, 7, 5, 6]   7
    loc.2  [3, 4, 3, 7, 7, 8, 6]   8
    loc.3  [1, 4, 3, 1, 7, 8, 6]   8
    ...

但这不起作用,因为我不能使用b.split,因为它没有定义......

3 个答案:

答案 0 :(得分:3)

如果在列表理解中使用NaNmax

,请使用不map的列表。
a['max'] = [max(x) for x in a['b']]
a['max'] = list(map(max, a['b']))

纯大熊猫解决方案:

a['max'] = pd.DataFrame(a['b'].values.tolist()).max(axis=1)

<强>示例

array = {'loc.1': np.array([  1,2,3,4,7,5,6]),
         'loc.2': np.array([  3,4,3,7,7,8,6]),
         'loc.3': np.array([  1,4,3,1,7,8,6])}

L = [(k, v) for k, v in array.items()]
a = pd.DataFrame(L, columns=['a','b']).set_index('a')

a['max'] = [max(x) for x in a['b']]
print (a)
                           b  max
a                                
loc.1  [1, 2, 3, 4, 7, 5, 6]    7
loc.2  [3, 4, 3, 7, 7, 8, 6]    8
loc.3  [1, 4, 3, 1, 7, 8, 6]    8

编辑:

您还可以在max中获得list comprehension

L = [(k, v, max(v)) for k, v in array.items()]
a = pd.DataFrame(L, columns=['a','b', 'max']).set_index('a')

print (a)
                           b  max
a                                
loc.1  [1, 2, 3, 4, 7, 5, 6]    7
loc.2  [3, 4, 3, 7, 7, 8, 6]    8
loc.3  [1, 4, 3, 1, 7, 8, 6]    8

答案 1 :(得分:0)

您可以使用numpy数组进行矢量化计算:

df = pd.DataFrame({'a': ['loc.1', 'loc.2', 'loc.3'],
                   'b': [[1, 2, 3, 4, 7, 5, 6],
                         [3, 4, 3, 7, 7, 8, 6],
                         [1, 4, 3, 1, 7, 8, 6]]})

df['maxval'] = np.array(df['b'].values.tolist()).max(axis=1)

print(df)

#        a                      b  maxval
# 0  loc.1  [1, 2, 3, 4, 7, 5, 6]       7
# 1  loc.2  [3, 4, 3, 7, 7, 8, 6]       8
# 2  loc.3  [1, 4, 3, 1, 7, 8, 6]       8

答案 2 :(得分:0)

试试这个:

df["max_val"] = df["b"].apply(lambda x:max(x))