Python中的快速二维数组(矩阵),没有C扩展

时间:2012-02-28 22:15:52

标签: python matrix std

我需要为一个可以使用Python 2.7扩展的应用程序编写一个插件。它需要执行一个相当复杂的动态算法,该算法适用于整数的rectengular矩阵。

该应用程序附带的默认Python安装不包括像numpy这样的数字库,所以不幸的是我必须仅使用Python stdlib来实现它。

我尝试了几种不同的方法来表示内存中的矩阵:

values = defaultdict(int)
values = [[0 for _ in range(width)] for _ in range(height)]
values = [0] * (width * height)   # access like values[j*width + i] later
values = [[0] * width for _ in range(height)]

dict方法只是为了完整性,它实际上并不是非常有益,因为每个元素都被访问。

根据我的测量结果,最后一个似乎是最快的构建和访问。但是,我很惊讶没有内置的矩阵功能。从我到目前为止所学到的Python知识,如果你在stdlib中找不到一些明显的功能,最可能的原因是你看起来不够努力。

所以我想知道这是否可以进一步优化,例如使用array模块或我不知道的其他一些功能。

3 个答案:

答案 0 :(得分:2)

当矩阵变大时,array模块可能会更快,因为它可以更紧凑地打包值;它可以与values[j*width + i]约定一起使用。但是,不,Python标准库中没有多维数组,可能是因为(a)Numpy已经有效地填补了这个利基,并且(b)如果性能不是最重要的话,你总是可以列出一个列表。

最快的选择实际上取决于算法。当您处理的矩阵非常稀疏时,基于dict的方法实际上可能是最快的(在DP算法中它们通常不是,至少不是我看到的那些)。

答案 1 :(得分:0)

您可以使用默认字典,并使用2元组作为索引,或实现自定义类并实现__getitem____setitem__方法来处理2元组作为索引并存储导致Python数组:

from array import array
class Array2D(object):
    def __init__(self, w, h):
        self.data = array("f", [0] * w * h)
        self.width = w
    def __getitem__(self, index):
        return self.data[index[1] * self.width + index[0]]
    def __setitem__(self, index, value):
          self.data[index[1] * self.width + index[0]] = value

或者,使用defaultdict,您可能会获得更好的性能:

>>> from collections import defaultdict
>>> d = defaultdict(lambda : 0)
>>> d[0,0]
0
>>> d[0,0] = 2.5
>>> d[0,0]
2.5
>>> 

答案 2 :(得分:0)

这可能会有所帮助:

arr=[*map(lambda a: [a]*cols,[0]*rows)]

这将创建一个零的二维(行x cols)矩阵

  

[[0,0,0],[0,0,0]]