如何在pysolr中使用facet

时间:2013-12-30 16:25:43

标签: python pysolr

我已成功使用pysolr构建了一个python搜索应用程序。到目前为止,我使用了两个字段:id和title。现在我想推出两个不同版本的标题;删除停用词后的原始和标题。有任何想法吗?以下代码有效:

def BuildSolrIndex(solr, trandata):
    tmp = []
    for i, dat in enumerate(trandata):
        if all(d is not None and len(d) > 0 for d in dat):
            d = {}
            d["id"] = dat[0]
            d["title"] = dat[1]
            tmp.append(d)
    solr.add(tmp)
    solr.optimize()
    return solr

但这个没有:

def BuildSolrIndex(solr, trandata):
    tmp = []
    for i, dat in enumerate(trandata):
        if all(d is not None and len(d) > 0 for d in dat):
            d = {}
            d["id"] = dat[0]
            d["title_org"] = dat[1]
            d["title_new"] = CleanUpTitle(dat[1])
            tmp.append(d)
    solr.add(tmp)
    solr.optimize()
    return solr

有什么想法吗?

修改

贝洛是一个例外:

Traceback (most recent call last):
    ...
    solr = BuildSolrIndex(solr, trandata)
  File "...", line 56, in BuildSolrIndex
    solr.add(tmp)
  File "build/bdist.linux-x86_64/egg/pysolr.py", line 779, in add
  File "build/bdist.linux-x86_64/egg/pysolr.py", line 387, in _update
  File "build/bdist.linux-x86_64/egg/pysolr.py", line 321, in _send_request
pysolr.SolrError: [Reason: None]
<response><lst name="responseHeader"><int name="status">400</int><int name="QTime">8</int></lst><lst name="error"><str name="msg">ERROR: [doc=...] unknown field 'title_new'</str><int name="code">400</int></lst></response>

1 个答案:

答案 0 :(得分:1)

这看起来与您的Solr schema.xml有关,因为异常表示“title_new”未被识别为有效字段。这个答案可能对您有所帮助:https://stackoverflow.com/a/14400137/1675729

检查以确保schema.xml包含“title_new”字段,并在必要时重新启动Solr服务。如果这不能解决您的问题,请回来!