尽管已安装熊猫,但我无法在PyCharm上使用熊猫读取任何CSV文件。

时间:2019-10-25 16:20:00

标签: python pandas pycharm

import pandas as pd
import numpy as np
data = pd.read_csv('dataset.csv')
print(data.head())
  

回溯(最近通话最近一次):文件“ C:/ Users / Shantanu   Shubham / PycharmProjects / dash / dashboard.py“,第6行,在       数据= pd.read_csv('gapminder.csv')文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”,   parser_f中的第685行       返回_read(filepath_or_buffer,kwds)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”,   _read中的第463行       数据= parser.read(nrows)文件“ C:\ Users \ Shantanu Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ io \ parsers.py”,   1169行,已读       df = DataFrame(col_dict,columns =列,index = index)文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ frame.py“,   第411行,在 init       mgr = init_dict(数据,索引,列,dtype = dtype)文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ construction.py“,   init_dict中的第257行       返回arrays_to_mgr(数组,数据名称,索引,列,dtype = dtype)文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ construction.py“,   第87行,在arrays_to_mgr中       返回create_block_manager_from_arrays(数组,arr_names,axes)文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”,   第1694行,位于create_block_manager_from_arrays中       块= form_blocks(数组,名称,轴)文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”,   第1752行,在form_blocks中       float_blocks = _multi_blockify(items_dict [“ FloatBlock”])文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”,   第1846行,在_multi_blockify中       值,放置= _stack_arrays(list(tup_block),dtype)文件“ C:\ Users \ Shantanu   Shubham \ PycharmProjects \ dash \ venv \ lib \ site-packages \ pandas \ core \ internals \ managers.py”,   第1874行,在_stack_arrays中       Stacked = np.empty(shape,dtype = dtype)MemoryError:无法分配形状为(535,79309)且数据类型为float64的数组

     

以退出代码1完成的过程

2 个答案:

答案 0 :(得分:0)

这意味着您正在读取的文件大于可用的RAM数量。有几种方法可以使用可以阅读的生成器将文件拆分为“块”。

答案 1 :(得分:0)

您确定要导入的文件具有正确的内容/结构吗?

错误消息“无法分配形状为(535,79309)的数组”使我认为文件内容有问题。

形状函数的工作原理如下:

from numpy import array
data = [[11, 22], [33, 44], [55, 66]]
data = array(data)
print(data.shape)

最终您会得到:

(3, 2)

现在,您要读取的数组的形状为(535,79309)-很大,是吧?