迭代列表时删除值的最有效方法

时间:2018-02-22 07:08:34

标签: python list loops

我有一个包含来自几个不同科目的X,Y坐标的数据集。因此,对象1到对象n各自具有单独的XY。我将所有X和Y坐标附加到名为plot的单独列表列表中。因此,一个列表用于X,一个用于来自每个主题的Y.

示例输入(3个科目):

Subject 1_X Subject 1_Y Subject 2_X Subject 2_Y Subject 3_X Subject 3_Y
11          45          34          67          8           26
12          46          33          65          7           25

示例输出:

plot[0] = [[11,34,8],[12,33,7]] #X's
plot[1] = [[45,67,26],[46,65,25]] #Y's

在此之前,我想在X值低于某个阈值(在这种情况下为10)时删除X和相应的Y.以下示例输出:(主题3已删除)

plot[0] = [[11,34],[12,33]] #X's
plot[1] = [[45,67],[46,65]] #Y's

此过程在此复制:

data = [random.sample(range(80), 40) for _ in range(75000)] #Similar size and format

plot = [[],[]]

n = 0
for row in data :
    if n == 0 :
        n+=1
        continue
    x_data = []
    y_data = []
    for (x,y) in [(0,1),(2,3), (4,5), (6,7), (8,9), (10,11), (12,13), (14,15), (16,17), (18,19), (20,21), (22,23), (24,25), (26,27), (28,29), (30,31), (32,33), (34,35), (36,37), (38,39)] : 
        xcoord = float(row[x])
        ycoord = float(row[y])
        if xcoord >= 10 :
            x_data.append(xcoord)
            y_data.append(ycoord)
            plot[0].append(x_data)
            plot[1].append(y_data)

这可以完成工作,但我使用这些列表来创建动画散点图。这是非常缓慢的。

如果删除消除值< 10的函数并优化重复项,则执行速度会快得多。

n=0
for row in data :
    if n == 0 :
        n+=1
        continue 
plot[0].append(list(map(float, row[1:41][::2])))
plot[1].append(list(map(float, row[0:40][::2]))) 

是否有更快,更有效的方法来更快地迭代和删除特定值?

我试图从每个来源中单独删除值,然后在最后追加,但这比我现在的效率更低。

使用以下方法调用散点图:

scatter = ax.scatter(plot[0][0], plot[1][0], c=['blue'])

使用以下内容调用动画:

def animate(i) :
    scatter.set_offsets.([[plot[0][0+i][0], plot[1][0+i][0]]])

1 个答案:

答案 0 :(得分:4)

在这种情况下,您最好使用numpy, 因为如果我理解正确,您的代码可以简化为以下内容:

import numpy as np

data = np.random.randint(0, 80, size=(2, 75000))  # Get a 2x75000 array of values in range [0, 79]

valid = data[0] >= 10  # Mask based on X-value
xdata, ydata = data[:, valid]  # Cut the parts you want