Question

在使用简单架构创建了一个嗖嗖索引并索引了150万条记录后，我在15秒内接近1000个搜索结果。

schema = Schema(tax_id=STORED, name=TEXT(stored=True))

MAIN * .seg文件的大小约为190 Mb。

我正在搜索的方式如下

 ix=open_dir("index")
  with ix.searcher() as searcher:
        query = QueryParser("name", ix.schema).parse(u'putrefaciens')
         results = searcher.search(query)

我想知道这个表现是否在预期的线上，我们可以使用指定大小的whoosh进行更快的全文搜索。

Answer 1

不确定它是否对您的应用程序有帮助，但我只想注意TEXT字段比ID字段做的更复杂。

在我的whoosh应用程序中，我有一个“名称”TEXT字段，我用它进行“处理”索引/搜索。所以人们可以输入一些单词，如果它在名称中就会被找到。

我还有一个“name_exact”ID字段，如果我只想“按原样”和精确索引/查找。

如果后者足以满足您的应用需求，您可以尝试使用ID字段进行演奏。

正如Steve K已经指出的那样，使用最近的嗖嗖声（甚至是回购提示）也可能有所帮助。

慢慢的嗖嗖搜索

1 个答案: