他们是否可以在numpy ndarray中找到最常见的字符串元素?
A= numpy.array(['a','b','c']['d','d','e']])
result should be 'd'
答案 0 :(得分:10)
如果您想要一个笨拙的答案,可以使用np.unique
:
>>> unique,pos = np.unique(A,return_inverse=True) #Finds all unique elements and their positions
>>> counts = np.bincount(pos) #Count the number of each unique element
>>> maxpos = counts.argmax() #Finds the positions of the maximum count
>>> (unique[maxpos],counts[maxpos])
('d', 2)
虽然如果有两个具有相同计数的元素,这将只取unique
数组中的第一个。
使用此功能,您还可以按照元素计数轻松排序:
>>> maxsort = counts.argsort()[::-1]
>>> (unique[maxsort],counts[maxsort])
(array(['d', 'e', 'c', 'b', 'a'],
dtype='|S1'), array([2, 1, 1, 1, 1]))
答案 1 :(得分:3)
这是一种方式:
>>> import numpy
>>> from collections import Counter
>>> A = numpy.array([['a','b','c'],['d','d','e']])
>>> Counter(A.flat).most_common(1)
[('d', 2)]
提取'd'
留给读者练习。