现在我有一个新的数据集,前两列是X和Y点(通常它们代表位置。数据文件非常大,对于初始数据分析,我需要提取特定行(或接近行数据) ) - 有没有办法告诉numpy(或python,或pandas)提取这个特定的数据集 - 附件是一个例子,它是简化的,数据是非常圆的(实际数据不是这种情况)但会清楚地表明我需要的东西:
示例 编辑 *
import os
import sys
import numpy as np
X = list(range(45))*3
Y = list(range(1, 91, 2)) + list(range(20, 65, 1)) + list(range(1, 136, 3))
XY = zip(X, Y)
XYarray = np.array(XY).reshape(135, 2)
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
plt.plot(XYarray[:,0], XYarray[:,1], 'ro') #all data
plt.plot(XYarray[0:44,0], XYarray[0:44,1], 'b*') #first line to be teste
#plt.plot(XYarray[45:90,0], XYarray[45:90,1], 'g*') #other lines of interest
#plt.plot(XYarray[91:135,0], XYarray[91:135,1], 'gx') #otherline of ineters
fig.show()
我的所有数据都位于任意XY数组(表面空间数据)中 - 我需要提取可用的行;例如,我想只提取未注释的蓝色星形线 - 然后移动下一个(目前在代码中注释) 请记住,我的实际数据不是那么规律 希望有所帮助