在Java中创建倒排索引的最佳数据结构是什么?

时间:2014-09-25 01:44:32

标签: java information-retrieval indexer

我已经过滤了令牌流。 现在我需要为它创建一个Indexer。 我知道HashMap get / put操作是O(1)。所以我肯定会使用它。 决定最佳数据结构时的问题,请记住该索引器上的搜索查询。

1 个答案:

答案 0 :(得分:3)

倒排列表最合适的数据结构是trie数据结构。 hashmap的问题在于它只允许完全匹配。 trie数据结构的优点是它允许前缀匹配,例如,带来匹配带来的前缀。 Java中强大而高效的trie实现是Apache commons PatriciaTrie