import pandas as pd
import numpy as np
data = pd.read_csv('dataset.csv')
print(data.head())
回溯(最近通话最近一次):文件“ C:/ Users / Shantanu Shubham / PycharmProjects / dash / dashboard.py“,第6行,在 数据= pd.read_csv('gapminder.csv')文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”, parser_f中的第685行 返回_read(filepath_or_buffer,kwds)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”, _read中的第463行 数据= parser.read(nrows)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”, 1169行,已读 df = DataFrame(col_dict,columns =列,index = index)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ frame.py“, 第411行,在 init mgr = init_dict(数据,索引,列,dtype = dtype)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ construction.py“, init_dict中的第257行 返回arrays_to_mgr(数组,数据名称,索引,列,dtype = dtype)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ construction.py“, 第87行,在arrays_to_mgr中 返回create_block_manager_from_arrays(数组,arr_names,axes)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”, 第1694行,位于create_block_manager_from_arrays中 块= form_blocks(数组,名称,轴)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”, 第1752行,在form_blocks中 float_blocks = _multi_blockify(items_dict [“ FloatBlock”])文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”, 第1846行,在_multi_blockify中 值,放置= _stack_arrays(list(tup_block),dtype)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”, 第1874行,在_stack_arrays中 Stacked = np.empty(shape,dtype = dtype)MemoryError:无法分配形状为(535,79309)且数据类型为float64的数组
以退出代码1完成的过程
答案 0 :(得分:0)
这意味着您正在读取的文件大于可用的RAM数量。有几种方法可以使用可以阅读的生成器将文件拆分为“块”。
答案 1 :(得分:0)
您确定要导入的文件具有正确的内容/结构吗?
错误消息“无法分配形状为(535,79309)的数组”使我认为文件内容有问题。
形状函数的工作原理如下:
from numpy import array
data = [[11, 22], [33, 44], [55, 66]]
data = array(data)
print(data.shape)
最终您会得到:
(3, 2)
现在,您要读取的数组的形状为(535,79309)-很大,是吧?