我有一个非常大的数据集raw
,我最初选择这样的行:
raw = np.array(Some Matrix)
selected = [r for r in raw if r[1] == '20130525' and r[2] < 120000]
但这真的很慢,任何人都知道如何使用Numpy的内置函数加快速度?
答案 0 :(得分:1)
这将是标准的numpythonic方法:
selected = raw[(raw[:, 1] == '20130525') & (raw[:, 2] == 120000)]
但是如果你有一个object
类型的数组,加速可能会很少,因为混合数据类型表明。你到底在做什么?您可以使用重组吗?