我需要为一个可以使用Python 2.7扩展的应用程序编写一个插件。它需要执行一个相当复杂的动态算法,该算法适用于整数的rectengular矩阵。
该应用程序附带的默认Python安装不包括像numpy这样的数字库,所以不幸的是我必须仅使用Python stdlib来实现它。
我尝试了几种不同的方法来表示内存中的矩阵:
values = defaultdict(int)
values = [[0 for _ in range(width)] for _ in range(height)]
values = [0] * (width * height) # access like values[j*width + i] later
values = [[0] * width for _ in range(height)]
dict方法只是为了完整性,它实际上并不是非常有益,因为每个元素都被访问。
根据我的测量结果,最后一个似乎是最快的构建和访问。但是,我很惊讶没有内置的矩阵功能。从我到目前为止所学到的Python知识,如果你在stdlib中找不到一些明显的功能,最可能的原因是你看起来不够努力。
所以我想知道这是否可以进一步优化,例如使用array
模块或我不知道的其他一些功能。
答案 0 :(得分:2)
当矩阵变大时,array
模块可能会更快,因为它可以更紧凑地打包值;它可以与values[j*width + i]
约定一起使用。但是,不,Python标准库中没有多维数组,可能是因为(a)Numpy已经有效地填补了这个利基,并且(b)如果性能不是最重要的话,你总是可以列出一个列表。
最快的选择实际上取决于算法。当您处理的矩阵非常稀疏时,基于dict
的方法实际上可能是最快的(在DP算法中它们通常不是,至少不是我看到的那些)。
答案 1 :(得分:0)
您可以使用默认字典,并使用2元组作为索引,或实现自定义类并实现__getitem__
和__setitem__
方法来处理2元组作为索引并存储导致Python数组:
from array import array
class Array2D(object):
def __init__(self, w, h):
self.data = array("f", [0] * w * h)
self.width = w
def __getitem__(self, index):
return self.data[index[1] * self.width + index[0]]
def __setitem__(self, index, value):
self.data[index[1] * self.width + index[0]] = value
或者,使用defaultdict,您可能会获得更好的性能:
>>> from collections import defaultdict
>>> d = defaultdict(lambda : 0)
>>> d[0,0]
0
>>> d[0,0] = 2.5
>>> d[0,0]
2.5
>>>
答案 2 :(得分:0)
这可能会有所帮助:
arr=[*map(lambda a: [a]*cols,[0]*rows)]
这将创建一个零的二维(行x cols)矩阵
[[0,0,0],[0,0,0]]