使用:运算符索引numpy.void的numpy.ndarray(由numy.genfromtxt输出)

时间:2012-09-14 12:48:07

标签: numpy indexing python-2.7 genfromtxt

我使用numpy.genfromtxt生成数据,如下所示:

ConvertToDate = lambda s:datetime.strptime(s,"%d/%m/%Y")
data= numpy.genfromtxt(open("PSECSkew.csv", "rb"), 
                        delimiter=',',
                        dtype=[('CalibrationDate', datetime),('Expiry', datetime), ('B0', float), ('B1', float), ('B2', float), ('ATMAdjustment', float)],
                        converters={0: ConvertToDate, 1: ConvertToDate})

我现在想要提取最后4列(每行但在循环中,所以我们只考虑一行)来分离变量。所以我这样做:

    B0 = data[0][2]
    B1 = data[0][3]
    B2 = data[0][4]
    ATM = data[0][5]

但是如果我能做到这一点(例如我可以使用普通的2D ndarray)我会更喜欢它:

    B0, B1, B2, ATM = data[0][2:]

但是这给了我一个'无效索引'错误。有没有办法很好地做到这一点,还是我应该坚持使用4线方法?

1 个答案:

答案 0 :(得分:5)

作为np.genfromtxt的输出,你有一个结构化数组,即一维数组,其中每一行都是不同的字段。

如果您想访问某些字段,只需按名称访问它们:

data["B0"], data["B1"], ...

您也可以将它们分组:

data[["B0", "B1]]

它为你提供了一个'new'结构化数组,只包含你想要的字段(引用'new',因为数据没有被复制,它仍然与你的初始数组相同)。

如果您想要一些特定的“行”,请执行以下操作:

data[["B0","B1"]][0]

输出第一行。切片和花式索引工作也是如此。

所以,举个例子:

B0, B1, B2, ATM = data[["B0","B1","B2","ATMAdjustment"]][0]

如果你只想逐行访问那些字段,我建议先存储你想要的整个字段,然后迭代:

filtered_data = data[["B0","B1","B2","ATMAdjustment"]]
for row in filtered_data:
    (B0, B1, B2, ATM) = row
    do_something

甚至:

for (B0, B1, B2, ATM) in filtered_data:
    do_something