在矩阵的一维(有效)中进行随机播放?

时间:2013-10-25 19:25:35

标签: python random numpy swap shuffle

我正在尝试编写一个函数,该函数获取2D点和概率p的矩阵,并以概率p

更改或交换每个点坐标

所以我问question,我试图使用二进制序列作为特定矩阵swap_matrix=[[0,1],[1,0]]的幂的数组,以随机(以特定比例)交换给定的坐标一组2D点。但是我意识到power函数只接受整数值而不接受数组。对于整个矩阵,我可以理解shuffle,你无法指定具体的维度。

拥有这两个功能中的任何一个都可以。

例如:

swap(a=[[1,2],[2,3],[3,4],[3,5],[5,6]],b=[0,0,0,1,1])

应该返回[[1,2],[2,3],[3,4],[5,3],[6,5]]

刚刚弹出,现在我正在编辑的想法是:

def swap(mat,K,N):
    #where K/N is the proportion and K and N are natural numbers
    #mat is a N*2 matrix that I am planning to randomly changes 
    #it coordinates of each row or keep it as it is
    a=[[[0,1],[1,0]]]
    b=[[[1,0],[0,1]]]
    a=np.repeat(a,K,axis=0)
    b=np.repeat(b,N-K,axis=0)
    out=np.append(a,b,axis=0)
    np.random.shuffle(out)
    return np.multiply(mat,out.T)

我得到一个错误的原因我不能只展平一次以使矩阵可倍增!

我再次寻找一种有效的方法(在Matlab上下文中进行矢量化)。

P.S。在我的特殊情况下,矩阵的形状为(N,2),第二列为全部,如果有帮助的话。

1 个答案:

答案 0 :(得分:3)

也许这对你的目的来说足够好了。在快速测试中,它似乎比钝的for-loop方法快了大约13倍(@Naji,发布“低效”代码有助于进行比较)。

按照Jaime的评论编辑我的代码

def swap(a, b):
    a = np.copy(a)
    b = np.asarray(b, dtype=np.bool)
    a[b] = a[b, ::-1]  # equivalent to: a[b] = np.fliplr(a[b])
    return a

# the following is faster, but modifies the original array
def swap_inplace(a, b):
    b = np.asarray(b, dtype=np.bool)
    a[b] = a[b, ::-1]


print swap(a=[[1,2],[2,3],[3,4],[3,5],[5,6]],b=[0,0,0,1,1])

输出:

[[1 2]
 [2 3]
 [3 4]
 [5 3]
 [6 5]]

编辑以包含更详细的时间

我想知道我是否可以用Cython加速这一点,所以我更多地研究了效率:-)结果值得一提我认为(因为效率是实际问题的一部分),但我确实在道歉预付额外代码金额。

首先是结果..“cython”功能显然是最快的,比上面提出的Numpy解决方案快10倍。我提到的“钝循环方法”由名为“loop”的函数给出,但事实证明有更快的方法可以想象。我的纯Python解决方案只比上面的矢量化Numpy代码慢3倍!另外需要注意的是,“swap_inplace”大部分时间只比“交换”略快。此外,时间因不同的随机矩阵ab而有所不同......所以现在你知道了: - )

function     | milisec | normalized
-------------+---------+-----------
loop         | 184     | 10.
double_loop  |  84     |  4.7
pure_python  |  51     |  2.8
swap         |  18     |  1
swap_inplace |  17     |  0.95
cython       | 1.9     |  0.11

我使用的其余代码(似乎我认真地采用了这种方式:P):

def loop(a, b):
    a_c = np.copy(a)
    for i in xrange(a.shape[0]):
        if b[i]:
            a_c[i,:] = a[i, ::-1]

def double_loop(a, b):
    a_c = np.copy(a)
    n, m = a_c.shape
    for i in xrange(n):
        if b[i]:
            for j in xrange(m):
                a_c[i, j] = a[i, m-j-1]
    return a_c

from copy import copy
def pure_python(a, b):
    a_c = copy(a)
    n, m = len(a), len(a[0])
    for i in xrange(n):
        if b[i]:
            for j in xrange(m):
                a_c[i][j] = a[i][m-j-1]
    return a_c

import pyximport; pyximport.install()
import testcy
def cython(a, b):
    return testcy.swap(a, np.asarray(b, dtype=np.uint8))

def rand_bin_array(K, N):
    arr = np.zeros(N, dtype=np.bool)
    arr[:K]  = 1
    np.random.shuffle(arr)
    return arr

N = 100000
a = np.random.randint(0, N, (N, 2))
b = rand_bin_array(0.33*N, N)

# before timing the pure python solution I first did:
a = a.tolist()
b = b.tolist()


######### In the file testcy.pyx #########

#cython: boundscheck=False
#cython: wraparound=False

import numpy as np
cimport numpy as np

def swap(np.ndarray[np.int_t, ndim=2] a, np.ndarray[np.uint8_t, ndim=1] b):
    cdef np.ndarray[np.int_t, ndim=2] a_c
    cdef int n, m, i, j
    a_c = a.copy()
    n = a_c.shape[0]
    m = a_c.shape[1]
    for i in range(n):
        if b[i]:
            for j in range(m):
                a_c[i, j] = a[i, m-j-1]
    return a_c