从numpy矩阵中优化提取柱子

时间:2010-07-23 06:48:23

标签: python optimization numpy

说我有一个像这样的numpy矩阵:

[[ x1, x2, x3, ... ],
 [ y1, y2, y3, ... ],
 [ z1, z2, z3, ... ],
 [ 1,  1,  1,  ... ]]

我想从中提取像这样的列表列表:

[[x1, y1, z1], [x2, y2, z2], [x3, y3, z3], ... ]

这样做的最佳方式是什么?

目前我有:

tpoints = [pt[:3].tolist() for pt in numpy.asarray(tptmat.T)]

tolist()的调用占用了不成比例的时间,大约是我计划中最耗时功能所用时间的三分之一。

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
 14422540   69.777    0.000   69.777    0.000 {method 'tolist' of 'numpy.ndarray' objects}
       20   64.258    3.213  178.057    8.903 trans.py:152(_apply)
      ...

2 个答案:

答案 0 :(得分:3)

为什么不在转置之前删除最后一行?

m[:3].T.tolist()
#      ^^^^^^^^^ optional

Micro-benchmark显示此方法比您的方法快61%,如果您不将其转换为列表列表,则速度提高45倍,对于100×4矩阵。

$ python2.5 -m timeit -s 'import numpy; m = numpy.matrix([[5]*100,[6]*100,[7]*100,[1]*100])' 'm[:3].T'
100000 loops, best of 3: 6.26 usec per loop
$ python2.5 -m timeit -s 'import numpy; m = numpy.matrix([[5]*100,[6]*100,[7]*100,[1]*100])' 'm[:3].T.tolist()'
10000 loops, best of 3: 180 usec per loop
$ python2.5 -m timeit -s 'import numpy; m = numpy.matrix([[5]*100,[6]*100,[7]*100,[1]*100])' 'numpy.asarray(m[:3].T)'
100000 loops, best of 3: 10.9 usec per loop
$ python2.5 -m timeit -s 'import numpy; m = numpy.matrix([[5]*100,[6]*100,[7]*100,[1]*100])' '[p[:3].tolist()for p in numpy.asarray(m.T)]'
1000 loops, best of 3: 289 usec per loop

答案 1 :(得分:1)

你试过zip(*matrix)吗?这将离开你

[[x1, y1, z1, 1], [x2, y2, z2, 1], [x3, y3, z3, 1], ... ]

但列表生成可能仍会发生......

等待(额头拍掌)!这应该可以解决问题:

zip(*matrix[:3])

在交互式shell中:

>>> matrix = [[ 11, 12, 13, 14],
...           [ 21, 22, 23, 24],
...           [ 31, 32, 33, 34],
...           [  1,  1,  1,  1]]
>>> zip(*matrix[:3])
[(11, 21, 31), (12, 22, 32), (13, 23, 33), (14, 24, 34)]
>>>

这是一个元组列表,但这真的很重要吗?