从dask数据框中按索引选择几行?

时间:2018-04-30 17:25:25

标签: dask

df = dd.read_csv('csv',usecols=fields,skip_blank_lines=True)
len(df.iloc[0:5])

以上代码提出

AttributeError: 'DataFrame' object has no attribute 'iloc'

尝试了ix loc但无法根据索引选择行

2 个答案:

答案 0 :(得分:2)

Dask.dataframe不支持iloc。通常,如果没有先将其全部读入内存,就很难访问csv文件中的任何特定行。

但是,如果您只想在顶部显示一些行,那么我建议您使用.head()方法

>>> df.head()

答案 1 :(得分:1)

一种解决方法是在csv文件中将索引创建为列(即df_index),并像这样使用它:

selection = (df[ df['df_index'].isin( list_of_indexes ) ]).compute()