用熊猫加载csv的问题

时间:2020-01-21 14:56:09

标签: python pandas csv

我的代码:

raw_data = pd.read_csv("C:/my.csv")

我将其运行到文件后已加载,但我得到了:

C:\ Users \ user \ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ IPython \ core \ interactiveshell.py:3051:DtypeWarning:列(0,79,237,239,241,243,245,247,248,249,250,251,252,253,254,255,258,258,260,262,264类型。在导入时指定dtype选项,或将low_memory = False设置为false。 互动性=互动性,编译器=编译器,结果=结果)

问题:

  1. 这到底是什么意思?
  2. 如何解决?

对不起,我无法共享数据。

4 个答案:

答案 0 :(得分:2)

尝试这些

document.querySelectorAll("a").forEach((link) => {
  link.addEventListener("focus", function() {
    this.setAttribute("data-focus-method", i);
  });
  link.addEventListener("blur", function() {
    this.removeAttribute("data-focus-method");
  });
});

答案 1 :(得分:1)

pd.read_csv具有许多参数,可让您控制如何处理不同的列。

没有数据很难具体说明,因此请仔细阅读选项dtypeconverters可以做什么。

有关更多详细信息,请参见pandas manual

第一次尝试可能是

raw_data = pd.read_csv("C:/my.csv", dtype=str)

这应该使您能够读取数据并弄清楚如何在真正重要的列上设置数据类型。

答案 2 :(得分:1)

熊猫将所有数据读取到内存中。如果您的CSV很大,这可能是一项艰巨的任务。

  const MATCH = featureTogglesArray.find((feature: IFeatureToggle) => feature.name === featureToggle);
  return MATCH === undefined ? false : MATCH.enabled;

这会将CSV批量读取,而不是批量读取。

答案 3 :(得分:0)

尝试对pandas.read_csv使用参数dtype

您可以在这里找到:Pandas.read_csv

在CSV中,我只转换了字符串中的所有列,并且在加载数据集后,我使用

将我需要的列转换为数字
DataFrame[Column] = pandas.to_numeric(DataFrame[Column], errors='coerce')