使用适当且快速的数据结构在python对象中收集dict帧

时间:2017-02-07 08:03:03

标签: python oop dictionary data-structures

我使用的API每秒提供128个信号(和信号质量值)作为dict中的dict。我想将它们收集到1(或更多)秒的窗口中。

我的原生方法是使用相同的dict结构并将值附加到列表中(如下所示:Appending values to dictionary in Python)。

参见示例:

# the API provides data like this
def getFrame(i):
    return {"X":
                {"value" : i,
                 "quality": i*2},
             "AF3":
                {"value" : i*3,
                 "quality": i*4}
             }


# object to collect single frames
class WindowDto(object):
    def __init__(self, windowSize, header):
        self.header = header
        self.windowSize = windowSize
        self.data = {}
        for key in self.header:
            self.data[key] = {"value": [], "quality": []}

    def addFrame(self, frame):
        for key, val in frame.iteritems():
            field = self.data[key]
            field["value"].append(val["value"])
            field["quality"].append(val["quality"])


# the keys of a frame are known
header = ["X", "AF3"]
# the max frame count is also known, but not used yet
maxFrameCount = 8        

dto = WindowDto(maxFrameCount, header)
for i in range(8):
    dto.addFrame(getFrame(i))

print(dto.data)
# {'X': {'quality': [0, 2, 4, 6, 8, 10, 12, 14], 'value': [0, 1, 2, 3, 4, 5, 6, 7]}, 
#  'AF3': {'quality': [0, 4, 8, 12, 16, 20, 24, 28], 'value': [0, 3, 6, 9, 12, 15, 18, 21]}}

我认为addFrame()方法是潜在的瓶颈,因为我必须遍历整个结构。我正在寻找一种更智能的方法来执行add操作。有什么建议怎么做?

我也可以自由地改变值的存储方式(例如在数组中?)以提高性能。我知道窗口对象的标题值和最大大小。这些值稍后会作为列表处理(例如sum(data["X"]["values"])),但访问权限由WindowDto包装。

1 个答案:

答案 0 :(得分:1)

你做过任何剖析,也许你的服务器已经足够好了吗?!

import cProfile
cProfile.run('for i in range(128):dto.addFrame(getFrame(i))')
         899 function calls in 0.001 seconds
cProfile.run('for i in range(128**2):dto.addFrame(getFrame(i))')
         114691 function calls in 0.046 seconds