我有一个3D numpy数组,其中包含重复的元素。
counterTraj.shape
(13530, 1, 1
例如counterTraj包含以下元素:我仅显示了几个元素:
array([[[136.]],
[[129.]],
[[130.]],
...,
[[103.]],
[[102.]],
[[101.]]])
```
我需要找到不同元素的频率:示例:136计数5(例如),101计数12(例如)。数组元素不是固定的,而是随输入数据而变化。我尝试以下操作:
from collections import Counter
Counter(counterTraj)
产生以下错误:
> TypeError Traceback (most recent
call last)
<ipython-input-408-e3584b29b0bd> in <module>()
11 counterTraj=np.vstack(counterTraj)
12 counterTraj=counterTraj.reshape(len(counterTraj),1,1)
---> 13 Counter(counterTraj)
/usr/lib/python3.6/collections/__init__.py in __init__(*args, **kwds) 533 raise TypeError('expected at most 1 arguments, got %d' % len(args)) 534 super(Counter, self).__init__() --> 535 self.update(*args, **kwds) 536 537 def __missing__(self, key): /usr/lib/python3.6/collections/__init__.py in update(*args, **kwds) 620 super(Counter, self).update(iterable) # fast path when counter is empty 621 else: --> 622 _count_elements(self, iterable) 623 if kwds: 624 self.update(kwds) TypeError: unhashable type: 'numpy.ndarray'
如何找到具有频率的元素的出现并找到频率最高的元素?
答案 0 :(得分:2)
将numpy.unique
与return_counts=True
参数一起使用,这将返回数组中每个元素的计数。
# sample array
In [89]: np.random.seed(23)
In [90]: arr = np.random.randint(0, 10, 20)
In [92]: a, cnts = np.unique(arr, return_counts=True)
In [94]: high_freq, high_freq_element = cnts.max(), a[cnts.argmax()]
In [95]: high_freq, high_freq_element
Out[95]: (4, 9)
要仅选择出现在特定频率阈值之上的元素,可以使用:
In [96]: threshold = 2
# select elements which occur only more than 2 times
In [97]: a[cnts > threshold]
Out[97]: array([3, 5, 6, 9])