用于Java的Python Counter替代方法

时间:2015-09-02 08:41:52

标签: java python sorting data-structures

我一直在Python中使用Counter()数据结构作为键值存储,允许我使用most_common方法根据值来对对象进行排序。更多信息here

Java语言是否有类似的数据结构?例如,我已经看到很多相关的答案,重点是数据结构排序HashMapsTreeMaps最初并没有为此目的定义。在我的情况下,我通常需要保留对象的计数器,然后选择最常见的或具有最高分数的那些(前N个查询)。但是,我很难,因为我需要插入HashMap然后排序或使用多个数据结构。

2 个答案:

答案 0 :(得分:8)

来自here

  

Counter类与其他语言的bag或multisets相似。

Java没有Multiset类或模拟类。 Guava有一个MultiSet集合,可以完全满足您的需求。

在纯Java中,您可以使用Map和新的合并方法:

final Map<String, Integer> counts = new HashMap<>();

counts.merge("Test", 1, Integer::sum);
counts.merge("Test", 1, Integer::sum);
counts.merge("Other", 1, Integer::sum);
counts.merge("Other", 1, Integer::sum);
counts.merge("Other", 1, Integer::sum);

System.out.println(counts.getOrDefault("Test", 0));
System.out.println(counts.getOrDefault("Other", 0));
System.out.println(counts.getOrDefault("Another", 0));

输出:

2
3
0

您可以在几行代码中将此行为包装在一个类中:

public class Counter<T> {
    final Map<T, Integer> counts = new HashMap<>();

    public void add(T t) {
        counts.merge(t, 1, Integer::sum);
    }

    public int count(T t) {
        return counts.getOrDefault(t, 0);
    }
}

并像这样使用它:

final Counter<String> counts = new Counter<>();

counts.add("Test");
counts.add("Test");
counts.add("Other");
counts.add("Other");
counts.add("Other");

System.out.println(counts.count("Test"));
System.out.println(counts.count("Other"));
System.out.println(counts.count("Another"));

输出:

2
3
0

答案 1 :(得分:1)

这是一个看起来像Counter足以实现你想做的事情的类。

static class Counter<T> {

    final ConcurrentMap<T, Integer> counts = new ConcurrentHashMap<>();

    public void put(T it) {
        add(it, 1);
    }

    public void add(T it, int v) {
        counts.merge(it, v, Integer::sum);
    }

    public List<T> mostCommon(int n) {
        return counts.entrySet().stream()
                // Sort by value.
                .sorted((e1, e2) -> Integer.compare(e1.getValue(), e2.getValue()))
                // Top n.
                .limit(n)
                // Keys only.
                .map(e -> e.getKey())
                // As a list.
                .collect(Collectors.toList());
    }
}

public void test() {
    Counter<String> c = new Counter<>();
    String[] numbers = {"Zero", "One", "Two", "Three", "Four", "Five", "Six"};
    for (int i = 0; i < numbers.length; i++) {
        c.add(numbers[i], i);
    }
    System.out.println(c.mostCommon(3));
}

它使用Java 8功能。