如何减少数据框的大小?

时间:2019-05-29 13:16:22

标签: python machine-learning

我正在尝试通过以下代码从目录中读取多个csv文件,但是它将每个数据帧的大小从150000更改为150001,这在我使用训练有素的数据集输出(其大小为150000)进行测试时会导致问题。任何机构都可以解决这个问题?因为我是ML的一个完整的初学者,所以有很多建议,并且(解释)将不胜感激。请注意dataFrame.iloc()在这种情况下不起作用。

const TYPE_REGEX_STR = "a|b|c";

1 个答案:

答案 0 :(得分:1)

为什么要放header = None。如果您已经知道csv文件的第一行是列名,则放置header = 0,它将告诉熊猫将第一行作为标题而不是一行。这将导致尺寸正确。

代码也没有删除第一行,因此是错误的。要删除第一行,您必须使用df = df.iloc[1:]