我正在尝试编写一个函数,该函数获取2D点和概率p
的矩阵,并以概率p
所以我问question,我试图使用二进制序列作为特定矩阵swap_matrix=[[0,1],[1,0]]
的幂的数组,以随机(以特定比例)交换给定的坐标一组2D点。但是我意识到power函数只接受整数值而不接受数组。对于整个矩阵,我可以理解shuffle,你无法指定具体的维度。
拥有这两个功能中的任何一个都可以。
例如:
swap(a=[[1,2],[2,3],[3,4],[3,5],[5,6]],b=[0,0,0,1,1])
应该返回[[1,2],[2,3],[3,4],[5,3],[6,5]]
刚刚弹出,现在我正在编辑的想法是:
def swap(mat,K,N):
#where K/N is the proportion and K and N are natural numbers
#mat is a N*2 matrix that I am planning to randomly changes
#it coordinates of each row or keep it as it is
a=[[[0,1],[1,0]]]
b=[[[1,0],[0,1]]]
a=np.repeat(a,K,axis=0)
b=np.repeat(b,N-K,axis=0)
out=np.append(a,b,axis=0)
np.random.shuffle(out)
return np.multiply(mat,out.T)
我得到一个错误的原因我不能只展平一次以使矩阵可倍增!
我再次寻找一种有效的方法(在Matlab上下文中进行矢量化)。
P.S。在我的特殊情况下,矩阵的形状为(N,2)
,第二列为全部,如果有帮助的话。
答案 0 :(得分:3)
也许这对你的目的来说足够好了。在快速测试中,它似乎比钝的for-loop方法快了大约13倍(@Naji,发布“低效”代码有助于进行比较)。
按照Jaime的评论编辑我的代码
def swap(a, b):
a = np.copy(a)
b = np.asarray(b, dtype=np.bool)
a[b] = a[b, ::-1] # equivalent to: a[b] = np.fliplr(a[b])
return a
# the following is faster, but modifies the original array
def swap_inplace(a, b):
b = np.asarray(b, dtype=np.bool)
a[b] = a[b, ::-1]
print swap(a=[[1,2],[2,3],[3,4],[3,5],[5,6]],b=[0,0,0,1,1])
输出:
[[1 2]
[2 3]
[3 4]
[5 3]
[6 5]]
编辑以包含更详细的时间
我想知道我是否可以用Cython加速这一点,所以我更多地研究了效率:-)结果值得一提我认为(因为效率是实际问题的一部分),但我确实在道歉预付额外代码金额。
首先是结果..“cython”功能显然是最快的,比上面提出的Numpy解决方案快10倍。我提到的“钝循环方法”由名为“loop”的函数给出,但事实证明有更快的方法可以想象。我的纯Python解决方案只比上面的矢量化Numpy代码慢3倍!另外需要注意的是,“swap_inplace”大部分时间只比“交换”略快。此外,时间因不同的随机矩阵a
和b
而有所不同......所以现在你知道了: - )
function | milisec | normalized
-------------+---------+-----------
loop | 184 | 10.
double_loop | 84 | 4.7
pure_python | 51 | 2.8
swap | 18 | 1
swap_inplace | 17 | 0.95
cython | 1.9 | 0.11
我使用的其余代码(似乎我认真地采用了这种方式:P):
def loop(a, b):
a_c = np.copy(a)
for i in xrange(a.shape[0]):
if b[i]:
a_c[i,:] = a[i, ::-1]
def double_loop(a, b):
a_c = np.copy(a)
n, m = a_c.shape
for i in xrange(n):
if b[i]:
for j in xrange(m):
a_c[i, j] = a[i, m-j-1]
return a_c
from copy import copy
def pure_python(a, b):
a_c = copy(a)
n, m = len(a), len(a[0])
for i in xrange(n):
if b[i]:
for j in xrange(m):
a_c[i][j] = a[i][m-j-1]
return a_c
import pyximport; pyximport.install()
import testcy
def cython(a, b):
return testcy.swap(a, np.asarray(b, dtype=np.uint8))
def rand_bin_array(K, N):
arr = np.zeros(N, dtype=np.bool)
arr[:K] = 1
np.random.shuffle(arr)
return arr
N = 100000
a = np.random.randint(0, N, (N, 2))
b = rand_bin_array(0.33*N, N)
# before timing the pure python solution I first did:
a = a.tolist()
b = b.tolist()
######### In the file testcy.pyx #########
#cython: boundscheck=False
#cython: wraparound=False
import numpy as np
cimport numpy as np
def swap(np.ndarray[np.int_t, ndim=2] a, np.ndarray[np.uint8_t, ndim=1] b):
cdef np.ndarray[np.int_t, ndim=2] a_c
cdef int n, m, i, j
a_c = a.copy()
n = a_c.shape[0]
m = a_c.shape[1]
for i in range(n):
if b[i]:
for j in range(m):
a_c[i, j] = a[i, m-j-1]
return a_c