我正在使用ExtractingRequestHandler
将富文本文档索引到SOLR 3.4中,并且我无法使其表现得像我想要的那样。
我想将创建日期存储为稍后用于分面搜索的字段,并在schema.xml
中定义了以下内容:
<field name="creation_date" type="date" indexed="true" stored="true"/>
我的索引是这样的:
curl -s "http://localhost:8983/solr/update/extract?literal.id=myid&resource.name=myfile.xls&commit=true" -F myfile=@/path/to/myfile.xls
我获得了动态字段attr_creation_date
(其他规则确定),但我没有将其视为creation_date
。我也试图像copyField
那样尝试使用{<1}}。
<copyField source="attr_creation_date" dest="creation_date"/>
另一个尝试是把它放在solrconfig.xml
,但没有运气:
<str name="fmap.Creation-Date">creation_date</str>
我很确定我错过了一些基本的东西。非常感谢任何帮助!
ExtractingRequestHandler
中solrconfig.xml
的设置:
<requestHandler name="/update/extract" startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="fmap.content">text</str>
<str name="fmap.Last-Save-Date">last_save_date</str>
<str name="fmap.Creation-Date">creation_date</str>
<str name="fmap.Content-Type">content_type</str>
<str name="lowernames">true</str>
<str name="uprefix">attr_</str>
<str name="captureAttr">true</str>
<str name="fmap.a">links</str>
</lst>
</requestHandler>
我的schema.xml
文件(许多默认内容):https://gist.github.com/1358002