简单的方法来打印dask系列/数据框?

时间:2020-04-04 22:36:48

标签: python dask

在熊猫中,有很多方法可以用来查看内部数据,例如head,tail,loc,iloc,但是每当我在dask上调用这些方法之一时,我得到的就是:

Dask DataFrame Structure:
              Close
npartitions=1
               bool
                ...
Dask Name: try_loc, 9 tasks

不管我是否事先调用.compute()。我怎样才能看到数据框/系列中的数据?

我正在使用Visual Studio Code 1.38.1,python 3.7,dask 2.13.0

1 个答案:

答案 0 :(得分:1)

头,尾和计算全部返回正常的熊猫数据帧,这些帧应该以熟悉的方式打印到屏幕上。这是一个简单的示例:

In [1]: import dask                                                             

In [2]: df = dask.datasets.timeseries()                                         

In [3]: df                                                                      
Out[3]: 
Dask DataFrame Structure:
                   id    name        x        y
npartitions=30                                 
2000-01-01      int64  object  float64  float64
2000-01-02        ...     ...      ...      ...
...               ...     ...      ...      ...
2000-01-30        ...     ...      ...      ...
2000-01-31        ...     ...      ...      ...
Dask Name: make-timeseries, 30 tasks

In [4]: df.head()                                                               
Out[4]: 
                       id     name         x         y
timestamp                                             
2000-01-01 00:00:00  1014  Michael  0.326006 -0.247279
2000-01-01 00:00:01  1001    Laura  0.429982 -0.545960
2000-01-01 00:00:02  1003      Bob -0.454010  0.096530
2000-01-01 00:00:03   964    Wendy  0.939114  0.826197
2000-01-01 00:00:04  1008   Xavier  0.035316  0.793430