我一直在Python中使用Counter()数据结构作为键值存储,允许我使用most_common方法根据值来对对象进行排序。更多信息here。
Java语言是否有类似的数据结构?例如,我已经看到很多相关的答案,重点是数据结构排序HashMaps或TreeMaps最初并没有为此目的定义。在我的情况下,我通常需要保留对象的计数器,然后选择最常见的或具有最高分数的那些(前N个查询)。但是,我很难,因为我需要插入HashMap然后排序或使用多个数据结构。
答案 0 :(得分:8)
来自here:
Counter类与其他语言的bag或multisets相似。
Java没有Multiset类或模拟类。 Guava有一个MultiSet集合,可以完全满足您的需求。
在纯Java中,您可以使用Map和新的合并方法:
final Map<String, Integer> counts = new HashMap<>();
counts.merge("Test", 1, Integer::sum);
counts.merge("Test", 1, Integer::sum);
counts.merge("Other", 1, Integer::sum);
counts.merge("Other", 1, Integer::sum);
counts.merge("Other", 1, Integer::sum);
System.out.println(counts.getOrDefault("Test", 0));
System.out.println(counts.getOrDefault("Other", 0));
System.out.println(counts.getOrDefault("Another", 0));
输出:
2
3
0
您可以在几行代码中将此行为包装在一个类中:
public class Counter<T> {
final Map<T, Integer> counts = new HashMap<>();
public void add(T t) {
counts.merge(t, 1, Integer::sum);
}
public int count(T t) {
return counts.getOrDefault(t, 0);
}
}
并像这样使用它:
final Counter<String> counts = new Counter<>();
counts.add("Test");
counts.add("Test");
counts.add("Other");
counts.add("Other");
counts.add("Other");
System.out.println(counts.count("Test"));
System.out.println(counts.count("Other"));
System.out.println(counts.count("Another"));
输出:
2
3
0
答案 1 :(得分:1)
这是一个看起来像Counter
足以实现你想做的事情的类。
static class Counter<T> {
final ConcurrentMap<T, Integer> counts = new ConcurrentHashMap<>();
public void put(T it) {
add(it, 1);
}
public void add(T it, int v) {
counts.merge(it, v, Integer::sum);
}
public List<T> mostCommon(int n) {
return counts.entrySet().stream()
// Sort by value.
.sorted((e1, e2) -> Integer.compare(e1.getValue(), e2.getValue()))
// Top n.
.limit(n)
// Keys only.
.map(e -> e.getKey())
// As a list.
.collect(Collectors.toList());
}
}
public void test() {
Counter<String> c = new Counter<>();
String[] numbers = {"Zero", "One", "Two", "Three", "Four", "Five", "Six"};
for (int i = 0; i < numbers.length; i++) {
c.add(numbers[i], i);
}
System.out.println(c.mostCommon(3));
}
它使用Java 8功能。