Question

我正在尝试通过以下代码从目录中读取多个csv文件，但是它将每个数据帧的大小从150000更改为150001，这在我使用训练有素的数据集输出（其大小为150000）进行测试时会导致问题。任何机构都可以解决这个问题？因为我是ML的一个完整的初学者，所以有很多建议，并且（解释）将不胜感激。请注意dataFrame.iloc（）在这种情况下不起作用。

const TYPE_REGEX_STR = "a|b|c";

Answer 1

为什么要放header = None。如果您已经知道csv文件的第一行是列名，则放置header = 0，它将告诉熊猫将第一行作为标题而不是一行。这将导致尺寸正确。

代码也没有删除第一行，因此是错误的。要删除第一行，您必须使用df = df.iloc[1:]

如何减少数据框的大小？

1 个答案: