在SOLR中映射字段以进行分面

时间:2011-11-11 12:07:58

标签: solr lucene full-text-search apache-tika solr-cell

我正在使用ExtractingRequestHandler将富文本文档索引到SOLR 3.4中,并且我无法使其表现得像我想要的那样。

我想将创建日期存储为稍后用于分面搜索的字段,并在schema.xml中定义了以下内容:

<field name="creation_date" type="date" indexed="true" stored="true"/>

我的索引是这样的:

curl -s "http://localhost:8983/solr/update/extract?literal.id=myid&resource.name=myfile.xls&commit=true" -F myfile=@/path/to/myfile.xls

我获得了动态字段attr_creation_date(其他规则确定),但我没有将其视为creation_date。我也试图像copyField那样尝试使用{<1}}。

<copyField source="attr_creation_date" dest="creation_date"/>

另一个尝试是把它放在solrconfig.xml,但没有运气:

<str name="fmap.Creation-Date">creation_date</str>

我很确定我错过了一些基本的东西。非常感谢任何帮助!

ExtractingRequestHandlersolrconfig.xml的设置:

<requestHandler name="/update/extract" startup="lazy" 
    class="solr.extraction.ExtractingRequestHandler" >
    <lst name="defaults">

        <str name="fmap.content">text</str>
        <str name="fmap.Last-Save-Date">last_save_date</str>
        <str name="fmap.Creation-Date">creation_date</str>
        <str name="fmap.Content-Type">content_type</str>
        <str name="lowernames">true</str>
        <str name="uprefix">attr_</str>

        <str name="captureAttr">true</str>
        <str name="fmap.a">links</str>
    </lst>
</requestHandler>

我的schema.xml文件(许多默认内容):https://gist.github.com/1358002

0 个答案:

没有答案