我将数据划分为训练集和验证集,并意外地意识到我错过了行号123786896。我只想处理行号123786896。在熊猫中,可以使用熊猫读取文件时指定行号。 read_csv我知道我可以在以下方面做些事情:
switch (chordType) {
case '5': return [0, 7];
case '': return [0, 4, 7];
...
但是,从S3读取文件需要花费大量时间。
是否可以读取行号123786896?类似于:
data = pd.read_csv(file, nrows = 123786896)
desired_line = data.loc[123786895]
# process desired_line
谢谢
编辑:
desired_line = pd.read_csv(file, line_number = 123786896)
答案 from the original question of which this is marked duplicate的也要花费很多时间。