我使用dask
计算
from dask import dataframe
all_data = dataframe.read_csv(path)
total_sum = all_data.account_balance.sum()
csv文件具有名为account_balance
的列。
total_sum
是一个dd.Scalar
对象,似乎很难将其更改为整数。如何获得它的整数版本?或将其保存在包含数字的.txt
文件中也可以。
我也尝试过total_sum.compute()
。
谢谢。
答案 0 :(得分:3)
.compute()
确实为您带来了实数,如您在本例中所见:
In [18]: import dask.dataframe as dd
In [19]: d = dd.from_pandas(pd.DataFrame({'a': [3,3,3,3]}), npartitions=2)
In [20]: d.a.sum().compute()
Out[20]: 12