Dask支持带有标头的CSV文件

时间:2015-12-02 15:23:51

标签: python pandas dask

似乎dask不支持读取包含标题的CSV文件。当我尝试阅读时,我得到了

 TypeError: 'NoneType' object has no attribute '__getitem__'

我可以在没有问题的情况下使用pandas读取相同的文件,并且在没有标题的情况下使用dask,但是他们将第一行的dask属性作为标题。这是一个错误吗?

1 个答案:

答案 0 :(得分:0)

Dask.dataframe支持包含标题的CSV文件:

In [1]: cat foo.csv
name,amount
alice,100
bob,200

In [2]: import dask.dataframe as dd

In [3]: dd.read_csv('foo.csv').compute()
Out[3]: 
    name  amount
0  alice     100
1    bob     200

但通常CSV文件可能很棘手。如果您raise an issue的示例文件失败,我们可以跟踪发生的情况并解决问题。