在python 2D数组中排列值

时间:2012-04-29 11:17:54

标签: python

我是python的新手,我遇到了一个我无法解决的问题。

我有以下2D数组:

valuearray = [['A', '21', '45'], ['A', '12', '23'], 
              ['A', '54', '21'], ['A', '15', '54'], 
              ['B', '23', '53'], ['B', '34', '53'], 
              ['B', '32', '54'], ['B', '24', '13'], 
              ['C', '31', '43'], ['C', '42', '54'], 
              ['C', '35', '54'], ['C', '12', '11']]

A  21 45
A  12 23
A  54 21
A  15 54
B  23 53
B  34 53
B  32 54
B  24 13
C  31 43
C  42 54
C  35 54
C  12 11

我需要从此数组生成另一个数组,其中每个valuearray[0]的唯一值为valuearray[1valuearray[0]}的最大值为valuearray[2],每个valuearray[0]的最小值为resarray[] A 54 21 B 34 13 C 42 11 uniquenames = [] un = [] for i in range(len(valuearray)): un.append(valuearray[i][0]) uniquenames=uniq(un) test = [] for ci in range(len(valuearray)): for gn in range(len(uniquenames)): if(valuearray[ci][0] == uniquenames[gn]): # i don't know what to do here i tried append(valuearray[ci][0] , max(valuearray[ci][1]),min( valuearray[ci][2]))

结果将是:

{{1}}

编辑:抱歉没有展示我尝试的内容

{{1}}

但只附加一个参数,所以我不知道如何继续。

uniq是一个从列表中为我提供唯一值的函数。

1 个答案:

答案 0 :(得分:3)

我们可以使用itertools.groupbyzip()

轻松完成此操作
data = [
    ['A', '21', '45'],
    ['A', '12', '23'],
    ['A', '54', '21'],
    ['A', '15', '54'],
    ['B', '23', '53'],
    ['B', '34', '53'],
    ['B', '32', '54'],
    ['B', '24', '13'],
    ['C', '31', '43'],
    ['C', '42', '54'],
    ['C', '35', '54'],
    ['C', '12', '11']
]

from itertools import groupby
from operator import itemgetter

for name, values in groupby(data, itemgetter(0)):
    _, first, second = zip(*values)
    print(name, max(first), min(second))

我们在这里做的是使用groupby()按第一项对列表项进行分组。这给了我们三个列表 - 以A开头的记录列表,然后是B的列表,然后是C.还值得注意的是groupby()不需要对列表进行排序。

然后,我们使用zip()从三元组列表中将值解压缩为三个单值列表,从而从这些列表中提取值。我们丢弃第一列,因为它只是相关的A,B或C,然后取其他列的最大值和最小值来获得您想要的值。

这给了我们:

A 54 21
B 34 13
C 42 11

编辑:

如果您将自己的值作为文字,则可以使用list comprehensionstr.split()制作一个列表:

data = """\
A  21 45
A  12 23
A  54 21
A  15 54
B  23 53
B  34 53
B  32 54
B  24 13
C  31 43
C  42 54
C  35 54
C  12 11\
"""

data = [value.split() for value in data.split("\n")]

另一个编辑:

根据聊天情况,您可以丢弃额外的列,如下所示:

Python 3.x:

for name, values in groupby(data, itemgetter(0)):
    _, first, second, *_ = zip(*values)
    print(name, max(first), min(second))

Python 2.x:

for name, values in groupby(data, itemgetter(0)):
    first, second = zip(*values)[1:3]
    print name, max(first), min(second)

并使输出成为一个列表,而不是打印值:

def max_min_by_group(group):
    for name, values in group:
        _, first, second, *_ = zip(*values)
        yield [name, max(first), min(second)]

new = [item for item in max_min_by_group(groupby(data, itemgetter(0)))]

我们只是使用列表理解和生成器(我们可以在一个大行中执行此操作,但它将是笨重且不可读的)。这给了我们:

[['A', '54', '21'], ['B', '34', '13'], ['C', '42', '11']]