我有一个包含来自几个不同科目的X,Y坐标的数据集。因此,对象1到对象n各自具有单独的XY。我将所有X和Y坐标附加到名为plot
的单独列表列表中。因此,一个列表用于X,一个用于来自每个主题的Y.
示例输入(3个科目):
Subject 1_X Subject 1_Y Subject 2_X Subject 2_Y Subject 3_X Subject 3_Y
11 45 34 67 8 26
12 46 33 65 7 25
示例输出:
plot[0] = [[11,34,8],[12,33,7]] #X's
plot[1] = [[45,67,26],[46,65,25]] #Y's
在此之前,我想在X值低于某个阈值(在这种情况下为10)时删除X和相应的Y.以下示例输出:(主题3已删除)
plot[0] = [[11,34],[12,33]] #X's
plot[1] = [[45,67],[46,65]] #Y's
此过程在此复制:
data = [random.sample(range(80), 40) for _ in range(75000)] #Similar size and format
plot = [[],[]]
n = 0
for row in data :
if n == 0 :
n+=1
continue
x_data = []
y_data = []
for (x,y) in [(0,1),(2,3), (4,5), (6,7), (8,9), (10,11), (12,13), (14,15), (16,17), (18,19), (20,21), (22,23), (24,25), (26,27), (28,29), (30,31), (32,33), (34,35), (36,37), (38,39)] :
xcoord = float(row[x])
ycoord = float(row[y])
if xcoord >= 10 :
x_data.append(xcoord)
y_data.append(ycoord)
plot[0].append(x_data)
plot[1].append(y_data)
这可以完成工作,但我使用这些列表来创建动画散点图。这是非常缓慢的。
如果删除消除值< 10
的函数并优化重复项,则执行速度会快得多。
n=0
for row in data :
if n == 0 :
n+=1
continue
plot[0].append(list(map(float, row[1:41][::2])))
plot[1].append(list(map(float, row[0:40][::2])))
是否有更快,更有效的方法来更快地迭代和删除特定值?
我试图从每个来源中单独删除值,然后在最后追加,但这比我现在的效率更低。
使用以下方法调用散点图:
scatter = ax.scatter(plot[0][0], plot[1][0], c=['blue'])
使用以下内容调用动画:
def animate(i) :
scatter.set_offsets.([[plot[0][0+i][0], plot[1][0+i][0]]])
答案 0 :(得分:4)
在这种情况下,您最好使用numpy
,
因为如果我理解正确,您的代码可以简化为以下内容:
import numpy as np
data = np.random.randint(0, 80, size=(2, 75000)) # Get a 2x75000 array of values in range [0, 79]
valid = data[0] >= 10 # Mask based on X-value
xdata, ydata = data[:, valid] # Cut the parts you want