Counter对象的numpy ufunc
是否相同?
例如,要将N添加到计数器中的所有值,我必须这样做:
>>> from collections import Counter
>>> x = Counter(['foo', 'foo', 'bar', 'bar'])
>>> n = 2
>>> y = Counter({k:v+n for k,v in x.items()})
>>> x
Counter({'foo': 2, 'bar': 2})
>>> y
Counter({'foo': 4, 'bar': 4})
给定1万亿个密钥,它肯定比使用numpy
需要更长的时间:
>>> import numpy as np
>>> x = Counter(['foo', 'foo', 'bar', 'bar'])
>>> k, v = zip(*x.items())
>>> n = 2
>>> _v = np.array(v) + n
>>> y = Counter(dict(zip(k, list(_v))))
>>> y
Counter({'foo': 4, 'bar': 4})
还有其他方法可以为计数器中的所有值实现相同的+ N吗?
答案 0 :(得分:5)
您可以创建一个具有相同键的新计数器,只有增量然后与原始值相加:
increment = Counter(dict.fromkeys(x, n))
y = x + increment
并非Counter
个对象适合数万亿个密钥;如果您的数据集很大,请考虑使用不同的工具,例如数据库。
演示:
>>> from collections import Counter
>>> x = Counter(['foo', 'foo', 'bar', 'bar'])
>>> n = 2
>>> x + Counter(dict.fromkeys(x, n))
Counter({'foo': 4, 'bar': 4})
>>> y = Counter(['foo', 'foo', 'bar', 'bar', 'spam'])
>>> y + Counter(dict.fromkeys(y, n))
Counter({'foo': 4, 'bar': 4, 'spam': 3})
答案 1 :(得分:1)
如何使用默认值为+N
的{{3}}呢?
>>> from collections import defaultdict
>>> x = defaultdict(lambda: 2) # +N = +2
>>> for key in ['foo', 'foo', 'bar', 'bar']:
... x[key] += 1
...
>>> x
defaultdict(<function <lambda> at 0x0000000002A4D128>, {'foo': 4, 'bar': 4})