Dask元素明智的字符串隐含

时间:2019-04-25 23:27:50

标签: python numpy dask

我需要通过串联两个数组(最好是dask数组)为dask创建一个多索引。我为numpy找到了以下解决方案,但正在寻找简单的解决方案

cols=100000
index = np.array([x1 + x2 +x3 for x1,x2,x3 in zip(repeat(1,cols ).astype('str'),repeat('-',cols ),repeat(1,cols ).astype('str'))])

如果我将其传递给da.from_array(),它将使+两个数组失效。

我也尝试过np.core.defchararray.add(),它可以工作,但是可以将dask数组转换为numpy数组(据我所知)。

1 个答案:

答案 0 :(得分:1)

您可能想尝试da.map_blocks。您可以创建一个可以执行所需操作的numpy函数,然后da.map_blocks将该numpy函数逐块应用到组成dask数组的每个numpy数组上。