Python中的数据导入错误

时间:2018-06-22 16:24:57

标签: python matlab import dataset

我试图按以下方式在Python中导入MNIST数据集:

import h5py
f = h5py.File("mnist.h5")
x_test = f["x_test"]
x_train = f["x_train"]
y_test = f["y_test"]
y_train = f["y_train"]

说类型,y_train说h5py._hl.dataset.Dataset

为了数学上的方便,我想将它们转换为float。我试试这个:

D = x_train.astype(float)
y_train = y_train.astype(float)+np.ones((60000,1));

但是我得到了这个追溯:

Traceback (most recent call last):

  File "<ipython-input-14-f3677d523d45>", line 1, in <module>
    y_train = y_train.astype(float)+np.ones((60000,1));

TypeError: unsupported operand type(s) for +: 'AstypeContext' and 'float'

我在哪里错过了?谢谢。

1 个答案:

答案 0 :(得分:1)

您正在使用两个不同的库,它们对astype具有两种完全不同的含义。

如果您在numpy中进行此操作,则可以执行以下操作:

a = np.array([1, 2, 3])

a = a.astype(float) + np.ones((60000,1))

但是在h5py中,astype是一个不同的函数,应在上下文管理器中使用:

这将引发与您得到的错误相同的错误:

import h5py
f = h5py.File('mytestfile.hdf5', 'w')
dset = f.create_dataset("default", (100,))
dset.astype(float)  + np.ones((60000,1))

但是下面的代码可以工作(请参见h5py docs中的astype):

f = h5py.File('mytestfile.hdf5', 'w')
dset = f.create_dataset("default", (100,))

with dset.astype('float'):
    out = dset[:]
    out += np.ones((100,))

此问题类似于Creating reference to HDF dataset in H5py using astype