Solr错误的排序文本字段

时间:2011-11-03 08:21:10

标签: search sorting solr edismax

我在schema.xml中有“text_general”字段

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/><filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>

我已存储文件:

document1:
   spell = "contro un indice generale dei prezzi salito del 2, 1%. Rincari ben piщ evidenti, tra i prodotti da bar"
   testata = "Mattino di Padova (Il)"

document2:
   spell="con i prodotti di qualitа vinco la crisi dei consumi Farinetti: con"
   testata = "Italia Oggi"

document3
   spell = "convenienza Il 2008 porta i primi aumenti nei pre zi L'Ipercoop cresce il listino"
   testata = "Nuova Ferrara (La)"

“spell”和“testata”字段具有“text_general”类型。

为我搜索工作正常:

http://localhost:8080/solr/select?q={!type=edismax qf=spell v='co*'}

但是排序存在一些问题:

http://localhost:8080/solr/select?q={!type=edismax qf=spell v='co*'}&sort=testata desc

它返回了我的结果:

    document1:
       spell = "contro un indice generale dei prezzi salito del 2, 1%. Rincari ben piщ evidenti, tra i prodotti da bar"
       testata = "Mattino di Padova (Il)"

    document2:
       spell="con i prodotti di qualitа vinco la crisi dei consumi Farinetti: con"
       testata = "Italia Oggi"

    document3
       spell = "convenienza Il 2008 porta i primi aumenti nei pre zi L'Ipercoop cresce il listino"
       testata = "Nuova Ferrara (La)"

我不明白为什么我的排序工作不正常。它应该返回我的结果:

    document3
       spell = "convenienza Il 2008 porta i primi aumenti nei pre zi L'Ipercoop cresce il listino"
       testata = "Nuova Ferrara (La)"

    document1:
       spell = "contro un indice generale dei prezzi salito del 2, 1%. Rincari ben piщ evidenti, tra i prodotti da bar"
       testata = "Mattino di Padova (Il)"

    document2:
       spell="con i prodotti di qualitа vinco la crisi dei consumi Farinetti: con"
       testata = "Italia Oggi"

1 个答案:

答案 0 :(得分:25)

排序在多值和标记化字段上不起作用 由于testata已使用text_general字段类型定义,因此它将被标记,因此排序不会正常工作。

  

可以对文档的“得分”进行排序,也可以对任何文档进行排序   multiValued="false" indexed="true"字段提供该字段   非标记化(即:没有分析器)或仅使用分析器   产生一个Term(即:使用KeywordTokenizer)

来源:http://wiki.apache.org/solr/CommonQueryParameters#sort

使用string作为字段类型,并将title字段复制到新字段中。

<field name="testata_sort" type="string" indexed="true" stored="false"/>

<copyField source="testata" dest="testata_sort" />