如何将N添加到计数器的每个值? - 蟒蛇

时间:2015-08-02 12:04:34

标签: python numpy dictionary counter

Counter对象的numpy ufunc是否相同?

例如,要将N添加到计数器中的所有值,我必须这样做:

>>> from collections import Counter
>>> x = Counter(['foo', 'foo', 'bar', 'bar'])
>>> n = 2
>>> y = Counter({k:v+n for k,v in x.items()})
>>> x
Counter({'foo': 2, 'bar': 2})
>>> y
Counter({'foo': 4, 'bar': 4})

给定1万亿个密钥,它肯定比使用numpy需要更长的时间:

>>> import numpy as np
>>> x = Counter(['foo', 'foo', 'bar', 'bar'])
>>> k, v = zip(*x.items())
>>> n = 2
>>> _v = np.array(v) + n
>>> y = Counter(dict(zip(k, list(_v))))
>>> y
Counter({'foo': 4, 'bar': 4})

还有其他方法可以为计数器中的所有值实现相同的+ N吗?

2 个答案:

答案 0 :(得分:5)

您可以创建一个具有相同键的新计数器,只有增量然后与原始值相加:

increment = Counter(dict.fromkeys(x, n))
y = x + increment

并非Counter个对象适合数万亿个密钥;如果您的数据集很大,请考虑使用不同的工具,例如数据库。

演示:

>>> from collections import Counter
>>> x = Counter(['foo', 'foo', 'bar', 'bar'])
>>> n = 2
>>> x + Counter(dict.fromkeys(x, n))
Counter({'foo': 4, 'bar': 4})
>>> y = Counter(['foo', 'foo', 'bar', 'bar', 'spam'])
>>> y + Counter(dict.fromkeys(y, n))
Counter({'foo': 4, 'bar': 4, 'spam': 3})

答案 1 :(得分:1)

如何使用默认值为+N的{​​{3}}呢?

>>> from collections import defaultdict
>>> x = defaultdict(lambda: 2)  # +N = +2
>>> for key in ['foo', 'foo', 'bar', 'bar']:
...     x[key] += 1
...
>>> x
defaultdict(<function <lambda> at 0x0000000002A4D128>, {'foo': 4, 'bar': 4})