我已经被抓住了这个问题的时间比我承认的要长得多。我正在处理我的第一个项目,并且每天都会提供新的CSV数据。
CSV是一致的,全部来自同一个受信任的来源。然而,我感兴趣的数据从第30行开始并且长度不同;特别是我对第2,第4和第8列感兴趣。
我尝试过使用熊猫;然而,这会被第1-29行中的数据所吸引(其中大部分都是空白的)。
如何阅读这些特定范围并复制到数组或JSON?
答案 0 :(得分:1)
如果您对pandas
感到满意,可以执行以下操作:
import pandas as pd
filename = 'path/to/your.csv'
df = pd.read_csv(filename, skiprows=30, usecols=[2, 4, 8])
skiprows
可以是一个整数(要跳过的行数,从顶部开始),要排除的行列表,或者在每个行索引上调用的布尔调用。
usecols
可以是索引列表,列名列表,也可以是在每个列名称上调用的布尔调用。