在熊猫中,有很多方法可以用来查看内部数据,例如head,tail,loc,iloc,但是每当我在dask上调用这些方法之一时,我得到的就是:
Dask DataFrame Structure:
Close
npartitions=1
bool
...
Dask Name: try_loc, 9 tasks
不管我是否事先调用.compute()。我怎样才能看到数据框/系列中的数据?
我正在使用Visual Studio Code 1.38.1,python 3.7,dask 2.13.0
答案 0 :(得分:1)
头,尾和计算全部返回正常的熊猫数据帧,这些帧应该以熟悉的方式打印到屏幕上。这是一个简单的示例:
In [1]: import dask
In [2]: df = dask.datasets.timeseries()
In [3]: df
Out[3]:
Dask DataFrame Structure:
id name x y
npartitions=30
2000-01-01 int64 object float64 float64
2000-01-02 ... ... ... ...
... ... ... ... ...
2000-01-30 ... ... ... ...
2000-01-31 ... ... ... ...
Dask Name: make-timeseries, 30 tasks
In [4]: df.head()
Out[4]:
id name x y
timestamp
2000-01-01 00:00:00 1014 Michael 0.326006 -0.247279
2000-01-01 00:00:01 1001 Laura 0.429982 -0.545960
2000-01-01 00:00:02 1003 Bob -0.454010 0.096530
2000-01-01 00:00:03 964 Wendy 0.939114 0.826197
2000-01-01 00:00:04 1008 Xavier 0.035316 0.793430