我目前正在开展一个项目,我需要比较两个文本文档,对于文档1中出现的所有单词,将在文档2中重复,而不管单词的位置如何。例如,如果文件1包含10个出现单词“in”的段落,则文档2也必须包含10个出现的“in”。如果单词放在不同的位置没问题。我该怎么做?.....提前谢谢。
答案 0 :(得分:0)
构建一个Map<String,Integer>
,您可以在其中计算每个单词的出现次数。如果两个文档的地图相同,则您有“匹配的文档”。
Map<String,Integer> docToMap(String[] document) {
Map<String,Integer> map = new HashMap<>();
for (String s:document) {
Integer n=map.get(s);
n= n==null?1:(n+1);
map.put(s,n)
}
}