我正在使用Python,我需要找到执行以下任务的最有效方法。
任务:给定零和一的任何一维数组 v ,用 k > = 0表示所有子序列的数量 v 的那些。
我需要从 v 获得一个二维数组 w ,这样:
1)shape(w)=(k,len(v)),
2)对于每一个i = 1,..,k,“ w”的第i行是一个全零的数组,除了 v 的所有第i个子序列。>
让我举个例子:假设$ v $是数组
v=[0,1,1,0,0,1,0,1,1,1]
然后k = 3和 w 应该是数组
w=[[0,1,1,0,0,0,0,0,0,0],[0,0,0,0,0,1,0,0,0,0],[0,0,0,0,0,0,0,1,1,1]]
可以编写代码以多种方式执行此任务,例如:
import numpy as np
start=[]
end=[]
for ii in range(len(v)-1):
if (v[ii:ii+2]==[0,1]).all():
start.append(ii)
if (v[ii:ii+2]==[1,0]).all():
end.append(ii)
if len(start)>len(end):
end.append(len(v)-1)
w=np.zeros((len(start),len(v)))
for jj in range(len(start)):
w[jj,start[jj]+1:end[jj]+1]=np.ones(end[jj]-start[jj])
但是我需要在非常大的数组 v 上执行此任务,并且此任务是函数的一部分,然后进行最小化..因此,我需要它尽可能高效和快速。
因此,总而言之,我的问题是:在Python中执行计算的最有效方法是什么?
答案 0 :(得分:0)
这是一种矢量化方式-
def expand_islands2D(v):
# Get start, stop of 1s islands
v1 = np.r_[0,v,0]
idx = np.flatnonzero(v1[:-1] != v1[1:])
s0,s1 = idx[::2],idx[1::2]
# Initialize 1D id array of size same as expected o/p and has
# starts and stops assigned as 1s and -1s, so that a final cumsum
# gives us the desired o/p
N,M = len(s0),len(v)
out = np.zeros(N*M,dtype=int)
# Setup starts with 1s
r = np.arange(N)*M
out[s0+r] = 1
# Setup stops with -1s
if s1[-1] == M:
out[s1[:-1]+r[:-1]] = -1
else:
out[s1+r] = -1
# Final cumsum on ID array
out2D = out.cumsum().reshape(N,-1)
return N, out2D
样品运行-
In [105]: v
Out[105]: array([0, 1, 1, 0, 0, 1, 0, 1, 1, 1])
In [106]: k,out2D = expand_islands2D(v)
In [107]: k # number of islands
Out[107]: 3
In [108]: out2D # 2d output with 1s islands on different rows
Out[108]:
array([[0, 1, 1, 0, 0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 0, 1, 1, 1]])