比较所有出现的单词的两个文档

时间:2013-03-19 14:01:25

标签: java

我目前正在开展一个项目,我需要比较两个文本文档,对于文档1中出现的所有单词,将在文档2中重复,而不管单词的位置如何。例如,如果文件1包含10个出现单词“in”的段落,则文档2也必须包含10个出现的“in”。如果单词放在不同的位置没问题。我该怎么做?.....提前谢谢。

1 个答案:

答案 0 :(得分:0)

构建一个Map<String,Integer>,您可以在其中计算每个单词的出现次数。如果两个文档的地图相同,则您有“匹配的文档”。

 Map<String,Integer> docToMap(String[] document) {
   Map<String,Integer> map = new HashMap<>();
   for (String s:document) {
      Integer n=map.get(s);
      n= n==null?1:(n+1);
      map.put(s,n)
   }
 }