我想我可能会遗漏一些明显的东西,但我不熟悉python和pandas。我正在阅读一个大文本文件,只想使用范围内的行(61,75496)。我可以跳过前60行
keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60)
我怎样才能在这些值之间包含行?遗憾的是,没有 userows 参数。
是否有像
这样的东西range(start, stop, start, stop)?
答案 0 :(得分:5)
也许你可以使用nrows
参数来给出要读取的行数。
来自documentation -
nrows : int, default None
Number of rows of file to read. Useful for reading pieces of large files
代码 -
keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60,nrows=75436) #Here 75436 is 75496 - 60
答案 1 :(得分:1)
您可以使用nrows
参数
keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60, nrows=(74596-60))
答案 2 :(得分:0)
在documentation中,您可以使用跳过前几行
skiprows = X
其中X是整数。如果文件中有标题,例如几行,您也可以使用
直接跳到标题 header = X
从文件底部开始跳过行,并使用向上计数
skipfooter = X
一起将标题设置为第3行(并跳过上面的行),而忽略底部的4行:pd.read_csv('path/or/url/to/file.csv', skiprows=3, skipfooter=4)