numpy对象数组

时间:2011-02-02 17:22:53

标签: python numpy simulation

我正在尝试在Python中实现格子模型(lattice boltzmann)的模拟。格子的每个站点都具有许多属性,并根据某些规则与相邻站点交互。我认为创建一个包含所有属性的类并创建该类的实例网格可能很聪明。 (由于我对Python缺乏经验,这可能不是一个好主意,所以请随意评论我的方法。)

以下是我正在做的事情的玩具示例

class site:
    def __init__(self,a,...):
        self.a = a
        .... other properties ...
    def set_a(self, new_a):
        self.a = new_a

现在我想处理这些网站的2D / 3D网格(网格),所以我尝试执行以下操作(这里以2D 3x3网格为例,但在模拟中我需要的顺序为> 1000x1000X1000 )

lattice = np.empty( (3,3), dtype=object)
lattice[:,:] = site(3)

现在,问题是每个格点都引用相同的实例,例如

lattice[0,0].set_a(5)

还会将lattice [0,2] .a的值设置为5.此行为是不需要的。为了避免这个问题,我可以遍历每个网格点并逐个元素地分配对象,比如

for i in range(3):
    for j in range(3):
        lattice[i,j] = site(a)

但有没有更好的方法(不涉及循环)将对象分配给多维数组?

由于

3 个答案:

答案 0 :(得分:26)

您可vectorize课程的__init__功能:

import numpy as np

class Site:
    def __init__(self, a):
        self.a = a
    def set_a(self, new_a):
        self.a = new_a

vSite = np.vectorize(Site)

init_arry = np.arange(9).reshape((3,3))

lattice = np.empty((3,3), dtype=object)
lattice[:,:] = vSite(init_arry)

这可能看起来更干净,但与循环解决方案相比没有性能优势。列表推导答案会创建一个中间的python列表,这会导致性能下降。

答案 1 :(得分:6)

缺少的部分是Python将所有内容都视为参考。 (有一些“不可变”的对象,字符串,数字和元组,更像是值。)当你这样做时

lattice[:,:] = site(3)

你说的是“Python:创建一个新对象site,并告诉lattice的每个元素指向该对象。”要查看确实如此,请打印数组以查看对象的内存地址是否完全相同:

array([[<__main__.Site object at 0x1029d5610>,
        <__main__.Site object at 0x1029d5610>,
        <__main__.Site object at 0x1029d5610>],
       [<__main__.Site object at 0x1029d5610>,
        <__main__.Site object at 0x1029d5610>,
        <__main__.Site object at 0x1029d5610>],
       [<__main__.Site object at 0x1029d5610>,
        <__main__.Site object at 0x1029d5610>,
        <__main__.Site object at 0x1029d5610>]], dtype=object)

循环方式是一种正确的方法。使用numpy数组,这可能是您的最佳选择;使用Python列表,您还可以使用列表解析:

lattice = [ [Site(i + j) for i in range(3)] for j in range(3) ]

您可以将列表理解与numpy.array构造一起使用:

lattice = np.array( [ [Site(i + j) for i in range(3)] for j in range(3) ],
                    dtype=object)

现在,当您打印lattice时,它就是

array([[<__main__.Site object at 0x1029d53d0>,
        <__main__.Site object at 0x1029d50d0>,
        <__main__.Site object at 0x1029d5390>],
       [<__main__.Site object at 0x1029d5750>,
        <__main__.Site object at 0x1029d57d0>,
        <__main__.Site object at 0x1029d5990>],
       [<__main__.Site object at 0x1029d59d0>,
        <__main__.Site object at 0x1029d5a10>,
        <__main__.Site object at 0x1029d5a50>]], dtype=object)

所以你可以看到那里的每个对象都是唯一的。

您还应注意“setter”和“getter”方法(例如set_a)是非Pythonic。最好直接设置和获取属性,然后使用@property装饰器,如果你真的需要阻止对属性的写访问。

另请注意,使用CamelCase编写Python类是标准的,而不是小写。

答案 2 :(得分:4)

我不知道更好,但作为一个明确的循环集的替代,你可以写

lattice = np.empty( (3,3), dtype=object)
lattice.flat = [site(3) for _ in lattice.flat]

无论格子的形状如何都应该起作用。