快速方法Hash Numpy对象进行缓存

时间:2011-03-22 04:09:55

标签: python performance numpy

实施一个系统,当涉及到繁重的数学提升时,我想尽可能少地做。

我知道numpy对象的memoisation存在问题,因此实现了一个惰性密钥缓存以避免整个“过早优化”参数。

def magic(numpyarg,intarg):
    key = str(numpyarg)+str(intarg)

    try:
        ret = self._cache[key]
        return ret
    except:
        pass

    ... here be dragons ...
    self._cache[key]=value
    return value

但由于字符串转换需要很长时间......

t=timeit.Timer("str(a)","import numpy;a=numpy.random.rand(10,10)")
t.timeit(number=100000)/100000 = 0.00132s/call

人们认为做“更好的方式”是什么意思?

3 个答案:

答案 0 :(得分:23)

借用this answer ......所以我猜这是重复的:

>>> import hashlib
>>> import numpy
>>> a = numpy.random.rand(10, 100)
>>> b = a.view(numpy.uint8)
>>> hashlib.sha1(b).hexdigest()
'15c61fba5c969e5ed12cee619551881be908f11b'
>>> t=timeit.Timer("hashlib.sha1(a.view(numpy.uint8)).hexdigest()", 
                   "import hashlib;import numpy;a=numpy.random.rand(10,10)") 
>>> t.timeit(number=10000)/10000
2.5790500640869139e-05

答案 1 :(得分:4)

这个joblib有一个包。来自this问题。

答案 2 :(得分:2)

对于小numpy数组,这也许是合适的:

tuple(map(float, a))

如果a是numpy数组。