Question

我使用numpy.genfromtxt生成数据，如下所示：

ConvertToDate = lambda s:datetime.strptime(s,"%d/%m/%Y")
data= numpy.genfromtxt(open("PSECSkew.csv", "rb"), 
                        delimiter=',',
                        dtype=[('CalibrationDate', datetime),('Expiry', datetime), ('B0', float), ('B1', float), ('B2', float), ('ATMAdjustment', float)],
                        converters={0: ConvertToDate, 1: ConvertToDate})

我现在想要提取最后4列（每行但在循环中，所以我们只考虑一行）来分离变量。所以我这样做：

    B0 = data[0][2]
    B1 = data[0][3]
    B2 = data[0][4]
    ATM = data[0][5]

但是如果我能做到这一点（例如我可以使用普通的2D ndarray）我会更喜欢它：

    B0, B1, B2, ATM = data[0][2:]

但是这给了我一个'无效索引'错误。有没有办法很好地做到这一点，还是我应该坚持使用4线方法？

Answer 1

作为np.genfromtxt的输出，你有一个结构化数组，即一维数组，其中每一行都是不同的字段。

如果您想访问某些字段，只需按名称访问它们：

data["B0"], data["B1"], ...

您也可以将它们分组：

data[["B0", "B1]]

它为你提供了一个'new'结构化数组，只包含你想要的字段（引用'new'，因为数据没有被复制，它仍然与你的初始数组相同）。

如果您想要一些特定的“行”，请执行以下操作：

data[["B0","B1"]][0]

输出第一行。切片和花式索引工作也是如此。

所以，举个例子：

B0, B1, B2, ATM = data[["B0","B1","B2","ATMAdjustment"]][0]

如果你只想逐行访问那些字段，我建议先存储你想要的整个字段，然后迭代：

filtered_data = data[["B0","B1","B2","ATMAdjustment"]]
for row in filtered_data:
    (B0, B1, B2, ATM) = row
    do_something

甚至：

for (B0, B1, B2, ATM) in filtered_data:
    do_something

使用：运算符索引numpy.void的numpy.ndarray（由numy.genfromtxt输出）

1 个答案: