通过使用Pandas包删除最后100k行,从现有文件创建新的csv文件

时间:2017-10-29 15:32:19

标签: python pandas csv

我尝试从现有文件创建新的csv文件。我原来的csv文件有30万条记录,其中我想要第1 200 000条记录。我正在使用python中的pandas包,因为我目前正在从事机器学习项目。 我试过了:

import pandas as pd

df = pd.read_csv('sample_submission.csv')
df = df.head(2000002)
df.to_csv('solution.csv')

以及

import pandas as pd

df = pd.read_csv('sample_submission.csv')
df = df[:2000002]
df.to_csv('solution.csv')

但没有成功。我该怎样做才能实现我的目标?

1 个答案:

答案 0 :(得分:2)

我认为您需要skipfooter参数来省略最后N行。

df = pd.read_csv('sample_submission.csv', skipfooter = 1000000)

如果要先读取N行,请使用read_csv中的参数nrows

df = pd.read_csv('sample_submission.csv', nrows=2000002)