我获取输入文本文件,将其转换为数组,对数组进行排序,然后获取每个单词的频率。我无法弄清楚如何根据它们的频率对它们进行排序,从最高到最低,而不会导入很多东西(这就是我想要做的):
//find frequencies
int count = 0;
List<String> list = new ArrayList<>();
for(String s:words){
if(!list.contains(s)){
list.add(s);
}
}
for(int i=0;i<list.size();i++){
for(int j=0;j<words.length;j++){
if(list.get(i).equals(words[j])){
count++;
}
}
System.out.println(list.get(i) + "\t" + count);
count=0;
}
这将以未按顺序的顺序返回其频率的单词,例如:
the 3
with 7
he 8
等
我希望将其排序为:
he 8
with 7
the 3
答案 0 :(得分:2)
我建议使用一个小助手类:
class WordFreq implements Comparable<WordFreq> {
final String word;
int freq;
@Override public int compareTo(WordFreq that) {
return Integer.compare(this.freq, that.freq);
}
}
构建此类的实例数组,每个单词一个,然后使用Arrays.sort
对数组进行排序。
答案 1 :(得分:1)
我是这样实现的,
private static class Tuple implements Comparable<Tuple> {
private int count;
private String word;
public Tuple(int count, String word) {
this.count = count;
this.word = word;
}
@Override
public int compareTo(Tuple o) {
return new Integer(this.count).compareTo(o.count);
}
public String toString() {
return word + " " + count;
}
}
public static void main(String[] args) {
String[] words = { "the", "he", "he", "he", "he", "he", "he", "he",
"he", "the", "the", "with", "with", "with", "with", "with",
"with", "with" };
// find frequencies
Arrays.sort(words);
Map<String, Integer> map = new HashMap<String, Integer>();
for (String s : words) {
if (map.containsKey(s)) {
map.put(s, map.get(s) + 1);
} else {
map.put(s, 1);
}
}
List<Tuple> al = new ArrayList<Tuple>();
for (Map.Entry<String, Integer> entry : map.entrySet()) {
al.add(new Tuple(entry.getValue(), entry.getKey()));
}
Collections.sort(al);
System.out.println(al);
}
输出是,
[the 3, with 7, he 8]
答案 2 :(得分:0)
您应该创建一个Word
类型的对象,该对象包含单词的String
值及其频率。
然后,您可以实施compareTo
或使用Comparator
并在Collections.sort()
类型列表中调用Word
答案 3 :(得分:0)
使用Map<String, Integer>
代替您将String
作为键,将频率存储为值,初始值为1.如果该单词已存在,则只需将该值增加1即可更新该值。然后,将此地图转换为Map<Integer, List<String>>
(或Guava Multimap
),并使用Integer
值作为键,并使用String
键将其存储为值。