我导入了fetch_mldata 来自sklearn.datasets import fetch_mldata 并呼吁:
dataset = fetch_mldata('MNIST original')
但我得到的是以下内容:
> Traceback (most recent call last): File "<stdin>", line 1, in
> <module> File
> "C:\Users\Jacob\Development\Anaconda\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py",
> line 540, in runfile
> execfile(filename, namespace) File "C:/Users/Jacob/Documents/Dropbox/Technion/Semester 8/Machine
> learning/Demo3/Demo3.py", line 75, in <module>
> dataset = fetch_mldata('MNIST original') File "C:\Users\Jacob\Development\Anaconda\lib\site-packages\sklearn\datasets\mldata.py",
> line 158, in fetch_mldata
> matlab_dict = io.loadmat(matlab_file, struct_as_record=True) File
> "C:\Users\Jacob\Development\Anaconda\lib\site-packages\scipy\io\matlab\mio.py",
> line 126, in loadmat
> matfile_dict = MR.get_variables(variable_names) File "C:\Users\Jacob\Development\Anaconda\lib\site-packages\scipy\io\matlab\mio5.py",
> line 288, in get_variables
> res = self.read_var_array(hdr, process) File "C:\Users\Jacob\Development\Anaconda\lib\site-packages\scipy\io\matlab\mio5.py",
> line 248, in read_var_array
> return self._matrix_reader.array_from_header(header, process) File "mio5_utils.pyx", line 616, in
> scipy.io.matlab.mio5_utils.VarReader5.array_from_header
> (scipy\io\matlab\mio5_utils.c:5903) File "mio5_utils.pyx", line 645,
> in scipy.io.matlab.mio5_utils.VarReader5.array_from_header
> (scipy\io\matlab\mio5_utils.c:5332) File "mio5_utils.pyx", line 713,
> in scipy.io.matlab.mio5_utils.VarReader5.read_real_complex
> (scipy\io\matlab\mio5_utils.c:6323) File "mio5_utils.pyx", line 417,
> in scipy.io.matlab.mio5_utils.VarReader5.read_numeric
> (scipy\io\matlab\mio5_utils.c:3873) File "mio5_utils.pyx", line 353,
> in scipy.io.matlab.mio5_utils.VarReader5.read_element
> (scipy\io\matlab\mio5_utils.c:3595) File "streams.pyx", line 324, in
> scipy.io.matlab.streams.FileStream.read_string
> (scipy\io\matlab\streams.c:4343) IOError: could not read bytes
我尝试下载更新版本的sklearn,但它没有帮助。 我是另一个关于这个问题的线索,但提供的解决方案并没有帮助我。 How to use datasets.fetch_mldata() in sklearn?
有什么想法吗?
答案 0 :(得分:3)
对于您/他人&#39;参考,我得到几乎相同的错误(Ubuntu),包括&#34; IOError:无法读取字节&#34;错误。
我刚刚在
发布了一个解决方案How to use datasets.fetch_mldata() in sklearn?
简短回答 - 使用以下内容:
{{1}}
将***(保留引号)替换为您的首选位置(数据目录)。
答案 1 :(得分:-1)
就我而言,根本原因是损坏的mnist-original.mat
文件。该文件已损坏,因为我在文件完全下载之前终止了Python。这使部分下载的mnist-original.mat
保留在C:\user\Taimi\scikit_learn_data\mldata
。
上面的解决方案对我有用,因为它只是在新位置获取了一个新副本。更直接的解决方案是找到损坏的mnist-original.mat
文件,删除它并再次尝试运行代码。正在运行的代码将再次下载mnist-original.mat
。完整的mnist-original.mat
尺寸为54,142 KB
,因此如果连接速度较慢,fetch_mldata()
将需要几分钟才能完成。