Python Pandas reads_csv跳过前x行和后y行

时间:2015-07-27 18:38:56

标签: python csv pandas

我想我可能会遗漏一些明显的东西,但我不熟悉python和pandas。我正在阅读一个大文本文件,只想使用范围内的行(61,75496)。我可以跳过前60行

keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60)

我怎样才能在这些值之间包含行?遗憾的是,没有 userows 参数。

是否有像

这样的东西
range(start, stop, start, stop)?

3 个答案:

答案 0 :(得分:5)

也许你可以使用nrows参数来给出要读取的行数。

来自documentation -

nrows : int, default None
Number of rows of file to read. Useful for reading pieces of large files

代码 -

keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60,nrows=75436) #Here 75436 is 75496 - 60

答案 1 :(得分:1)

您可以使用nrows参数

keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60, nrows=(74596-60))

答案 2 :(得分:0)

documentation中,您可以使用跳过前几行

skiprows = X

其中X是整数。如果文件中有标题,例如几行,您也可以使用

直接跳到标题

header = X

从文件底部开始跳过行,并使用向上计数

skipfooter = X

一起将标题设置为第3行(并跳过上面的行),而忽略底部的4行:pd.read_csv('path/or/url/to/file.csv', skiprows=3, skipfooter=4)