慢慢的嗖嗖搜索

时间:2012-08-09 00:29:23

标签: python indexing whoosh

在使用简单架构创建了一个嗖嗖索引并索引了150万条记录后,我在15秒内接近1000个搜索结果。

schema = Schema(tax_id=STORED, name=TEXT(stored=True))

MAIN * .seg文件的大小约为190 Mb。

我正在搜索的方式如下

 ix=open_dir("index")
  with ix.searcher() as searcher:
        query = QueryParser("name", ix.schema).parse(u'putrefaciens')
         results = searcher.search(query)

我想知道这个表现是否在预期的线上,我们可以使用指定大小的whoosh进行更快的全文搜索。

1 个答案:

答案 0 :(得分:0)

不确定它是否对您的应用程序有帮助,但我只想注意TEXT字段比ID字段做的更复杂。

在我的whoosh应用程序中,我有一个“名称”TEXT字段,我用它进行“处理”索引/搜索。所以人们可以输入一些单词,如果它在名称中就会被找到。

我还有一个“name_exact”ID字段,如果我只想“按原样”和精确索引/查找。

如果后者足以满足您的应用需求,您可以尝试使用ID字段进行演奏。

正如Steve K已经指出的那样,使用最近的嗖嗖声(甚至是回购提示)也可能有所帮助。