我有几个文本文件和几个单词的数据集。我必须匹配每个文本文件匹配的单词。如何实现?
我最初开始使用标记化每个文本文件,然后在HashMap(我的数据集)中查找每个单词。但这似乎是一项非常乏味的任务。我希望能在几秒钟内给出结果。
答案 0 :(得分:0)
如果你想让它快速发生。试试elastic search percolator。它完全符合您的要求。
对于java api,请检查此link。
答案 1 :(得分:0)
你想要完整的代码还是只需要概念
我想说创建一个
// string是Key,对象是您要映射到的对象,如count或者其他东西 //如果使用java
,你也可以使用泛型HashMap hashMap = new HashMap();
其中所有键都是单词集
然后对这些文件中的每个单词都做
hashMap.get( “thewordyouneedtolookup”);