从文件中提取匹配的单词

时间:2014-08-08 17:23:28

标签: java string search

我有几个文本文件和几个单词的数据集。我必须匹配每个文本文件匹配的单词。如何实现?

我最初开始使用标记化每个文本文件,然后在HashMap(我的数据集)中查找每个单词。但这似乎是一项非常乏味的任务。我希望能在几秒钟内给出结果。

2 个答案:

答案 0 :(得分:0)

如果你想让它快速发生。试试elastic search percolator。它完全符合您的要求。

对于java api,请检查此link

答案 1 :(得分:0)

你想要完整的代码还是只需要概念

我想说创建一个

// string是Key,对象是您要映射到的对象,如count或者其他东西 //如果使用java

,你也可以使用泛型

HashMap hashMap = new HashMap();

其中所有键都是单词集

然后对这些文件中的每个单词都做

hashMap.get( “thewordyouneedtolookup”);