我已经按照Getting Starting - Django Haystack示例,为我的模型换掉了他们的模型。 在search_indexes.py中,方法index_queryset具有注释"在更新模型的整个索引时使用。"但每次我从视图search/search.html
进行搜索时都会调用它方法本身从数据库中获取所有对象并且非常慢,因此我认为这不是预期的行为。
search_indexes.py
import datetime
from haystack import indexes
from article.models import Article
class ArticleIndex(indexes.SearchIndex, indexes.Indexable):
text = indexes.CharField(document=True, use_template=True)
article_id = indexes.IntegerField(model_attr='id')
title = indexes.CharField(model_attr='title')
summary = indexes.CharField(model_attr='summary')
content = indexes.CharField(model_attr='content')
published_at = indexes.DateTimeField(model_attr='published_at')
def get_model(self):
return Article
def index_queryset(self, using=None):
return self.get_model().objects.filter(
published_at__lte=datetime.datetime.now())
我捕获了堆栈跟踪以查看它的调用位置:
python2.7/site-packages/haystack/views.py(53)__call__()
-> return self.create_response()
python2.7/site-packages/haystack/views.py(133)create_response()
-> (paginator, page) = self.build_page()
python2.7/site-packages/haystack/views.py(110)build_page()
-> self.results[start_offset:start_offset + self.results_per_page]
python2.7/site-packages/haystack/query.py(272)__getitem__()
-> self._fill_cache(start, bound)
python2.7/site-packages/haystack/query.py(191)_fill_cache()
-> to_cache = self.post_process_results(results)
python2.7/site-packages/haystack/query.py(214)post_process_results()
-> objects = index.read_queryset(using=self.query._using)
python2.7/site-packages/haystack/indexes.py(144)read_queryset()
-> return self.index_queryset(using=using)
myApplication/article/search_indexes.py(20)index_queryset()
-> return self.get_model().objects.filter(
注意:我使用的是django版本1.7.10和django-haystack版本2.4.1
答案 0 :(得分:1)
这是预期的行为 - 文档字符串是错误的。函数index_queryset
基本上返回Haystack将用于获取搜索结果的查询集(以及索引文档)。
你说:
该方法本身从数据库获取所有对象并且非常慢
实际上它并没有。所有方法都返回一个查询集。 Querysets are lazy,因此该方法无法访问数据库。当某些东西试图访问查询集的结果时,数据库才会被触发。
这将在您执行搜索并且Haystack返回结果后发生。此时,将进一步过滤查询集以返回与搜索匹配的对象。如果这很慢,那么它可能表明您的模型结构存在更基本的性能问题。