Question

import pandas as pd
import numpy as np
data = pd.read_csv('dataset.csv')
print(data.head())

回溯（最近通话最近一次）：文件“ C：/ Users / Shantanu   Shubham / PycharmProjects / dash / dashboard.py“，第6行，在       数据= pd.read_csv（'gapminder.csv'）文件“ C：\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”，   parser_f中的第685行       返回_read（filepath_or_buffer，kwds）文件“ C：\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”，   _read中的第463行       数据= parser.read（nrows）文件“ C：\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”，   1169行，已读       df = DataFrame（col_dict，columns =列，index = index）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ frame.py“，   第411行，在 init       mgr = init_dict（数据，索引，列，dtype = dtype）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ construction.py“，   init_dict中的第257行       返回arrays_to_mgr（数组，数据名称，索引，列，dtype = dtype）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ construction.py“，   第87行，在arrays_to_mgr中       返回create_block_manager_from_arrays（数组，arr_names，axes）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”，   第1694行，位于create_block_manager_from_arrays中       块= form_blocks（数组，名称，轴）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”，   第1752行，在form_blocks中       float_blocks = _multi_blockify（items_dict [“ FloatBlock”]）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”，   第1846行，在_multi_blockify中       值，放置= _stack_arrays（list（tup_block），dtype）文件“ C：\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”，   第1874行，在_stack_arrays中       Stacked = np.empty（shape，dtype = dtype）MemoryError：无法分配形状为（535，79309）且数据类型为float64的数组

以退出代码1完成的过程

Answer 1

这意味着您正在读取的文件大于可用的RAM数量。有几种方法可以使用可以阅读的生成器将文件拆分为“块”。

Answer 2

您确定要导入的文件具有正确的内容/结构吗？

错误消息“无法分配形状为（535，79309）的数组”使我认为文件内容有问题。

形状函数的工作原理如下：

from numpy import array
data = [[11, 22], [33, 44], [55, 66]]
data = array(data)
print(data.shape)

最终您会得到：

(3, 2)

现在，您要读取的数组的形状为（535，79309）-很大，是吧？

尽管已安装熊猫，但我无法在PyCharm上使用熊猫读取任何CSV文件。

2 个答案: