我需要通过串联两个数组(最好是dask数组)为dask创建一个多索引。我为numpy找到了以下解决方案,但正在寻找简单的解决方案
cols=100000
index = np.array([x1 + x2 +x3 for x1,x2,x3 in zip(repeat(1,cols ).astype('str'),repeat('-',cols ),repeat(1,cols ).astype('str'))])
如果我将其传递给da.from_array(),它将使+两个数组失效。
我也尝试过np.core.defchararray.add(),它可以工作,但是可以将dask数组转换为numpy数组(据我所知)。
答案 0 :(得分:1)
您可能想尝试da.map_blocks。您可以创建一个可以执行所需操作的numpy函数,然后da.map_blocks
将该numpy函数逐块应用到组成dask数组的每个numpy数组上。