在使用简单架构创建了一个嗖嗖索引并索引了150万条记录后,我在15秒内接近1000个搜索结果。
schema = Schema(tax_id=STORED, name=TEXT(stored=True))
MAIN * .seg文件的大小约为190 Mb。
我正在搜索的方式如下
ix=open_dir("index")
with ix.searcher() as searcher:
query = QueryParser("name", ix.schema).parse(u'putrefaciens')
results = searcher.search(query)
我想知道这个表现是否在预期的线上,我们可以使用指定大小的whoosh进行更快的全文搜索。
答案 0 :(得分:0)
不确定它是否对您的应用程序有帮助,但我只想注意TEXT字段比ID字段做的更复杂。
在我的whoosh应用程序中,我有一个“名称”TEXT字段,我用它进行“处理”索引/搜索。所以人们可以输入一些单词,如果它在名称中就会被找到。
我还有一个“name_exact”ID字段,如果我只想“按原样”和精确索引/查找。
如果后者足以满足您的应用需求,您可以尝试使用ID字段进行演奏。
正如Steve K已经指出的那样,使用最近的嗖嗖声(甚至是回购提示)也可能有所帮助。