我正在尝试通过以下代码从目录中读取多个csv文件,但是它将每个数据帧的大小从150000更改为150001,这在我使用训练有素的数据集输出(其大小为150000)进行测试时会导致问题。任何机构都可以解决这个问题?因为我是ML的一个完整的初学者,所以有很多建议,并且(解释)将不胜感激。请注意dataFrame.iloc()在这种情况下不起作用。
const TYPE_REGEX_STR = "a|b|c";
答案 0 :(得分:1)
为什么要放header = None
。如果您已经知道csv文件的第一行是列名,则放置header = 0
,它将告诉熊猫将第一行作为标题而不是一行。这将导致尺寸正确。
代码也没有删除第一行,因此是错误的。要删除第一行,您必须使用df = df.iloc[1:]