内部列表中的第一项尽可能有效

时间:2012-10-26 09:50:22

标签: python list optimization performance

我在python A[row,col,value]中有一个协调的存储列表,用于存储非零值。

如何获取所有行索引的列表?我希望此A[0:][0]能够正常工作,print A[0:]打印整个列表,但print A[0:][0]仅打印A[0]

我要问的原因是为了有效计算每行中的非零值的数量,即迭代range(0,n),其中n是总行数。这应该比我目前for i in range(0,n): for j in A: ...的方式便宜

类似的东西:

c = []
# for the total number of rows
for i in range(0,n):
     # get number of rows with only one entry in coordinate storage list
     if A[0:][0].count(i) == 1: c.append(i)                
return c

在:

c = []
# for the total number of rows 
for i in range(0,n):
    # get the index and initialize the count to 0 
    c.append([i,0])
    # for every entry in coordinate storage list 
    for j in A:
        # if row index (A[:][0]) is equal to current row i, increment count  
        if j[0] == i:
           c[i][1]+=1
return c

编辑:

使用Junuxx的答案,this questionthis post我提出了以下(用于返回单行数)这对于我当前的问题大小来说要快得多A比我最初的尝试。但是它仍然随着行数和列数的增长而增长。我想知道是否有可能不必迭代A但是只能到n

# get total list of row indexes from coordinate storage list
row_indexes = [i[0] for i in A]
# create dictionary {index:count}
c = Counter(row_indexes)    
# return only value where count == 1 
return [c[0] for c in c.items() if c[1] == 1]

2 个答案:

答案 0 :(得分:11)

这应该这样做:

c = [x[0] for x in A]

这是一个列表理解,它采用A的每个元素的第一个(子)元素。

答案 1 :(得分:4)

对于效率和扩展切片,您可以使用numpy - 这个例子似乎是一个好主意:

import numpy as np
yourlist = [
    [0, 0, 0],
    [0, 1, 1],
    [1, 0, 2]
]
a = np.array(yourlist)
print a[:,0]
# [0 0 1]
bc = np.bincount(a[:,0])
# array([2, 1])
count = bc[bc==1].size
# 1
# or... (I think it's probably better...)
count = np.count_nonzero(bc == 1)