Question

我已经被抓住了这个问题的时间比我承认的要长得多。我正在处理我的第一个项目，并且每天都会提供新的CSV数据。

CSV是一致的，全部来自同一个受信任的来源。然而，我感兴趣的数据从第30行开始并且长度不同;特别是我对第2，第4和第8列感兴趣。

我尝试过使用熊猫;然而，这会被第1-29行中的数据所吸引（其中大部分都是空白的）。

如何阅读这些特定范围并复制到数组或JSON？

Answer 1

如果您对pandas感到满意，可以执行以下操作：

import pandas as pd

filename = 'path/to/your.csv'
df = pd.read_csv(filename, skiprows=30, usecols=[2, 4, 8])

skiprows可以是一个整数（要跳过的行数，从顶部开始），要排除的行列表，或者在每个行索引上调用的布尔调用。

usecols可以是索引列表，列名列表，也可以是在每个列名称上调用的布尔调用。

的文档