将Dask Scalar转换为整数值(或将其保存到文本文件)

时间:2018-07-23 16:27:09

标签: python pandas csv dask

我使用dask计算

from dask import dataframe
all_data = dataframe.read_csv(path) 
total_sum = all_data.account_balance.sum()

csv文件具有名为account_balance的列。

total_sum是一个dd.Scalar对象,似乎很难将其更改为整数。如何获得它的整数版本?或将其保存在包含数字的.txt文件中也可以。

我也尝试过total_sum.compute()

谢谢。

1 个答案:

答案 0 :(得分:3)

.compute()确实为您带来了实数,如您在本例中所见:

In [18]: import dask.dataframe as dd

In [19]: d = dd.from_pandas(pd.DataFrame({'a': [3,3,3,3]}), npartitions=2)

In [20]: d.a.sum().compute()
Out[20]: 12