我尝试从现有文件创建新的csv文件。我原来的csv文件有30万条记录,其中我想要第1 200 000条记录。我正在使用python中的pandas包,因为我目前正在从事机器学习项目。 我试过了:
import pandas as pd
df = pd.read_csv('sample_submission.csv')
df = df.head(2000002)
df.to_csv('solution.csv')
以及
import pandas as pd
df = pd.read_csv('sample_submission.csv')
df = df[:2000002]
df.to_csv('solution.csv')
但没有成功。我该怎样做才能实现我的目标?
答案 0 :(得分:2)
我认为您需要skipfooter
参数来省略最后N
行。
df = pd.read_csv('sample_submission.csv', skipfooter = 1000000)
如果要先读取N行,请使用read_csv
中的参数nrows
:
df = pd.read_csv('sample_submission.csv', nrows=2000002)