我是Solr的新手。我需要能够在Solr中搜索图像元数据。此外,我需要具有简单的搜索和查看功能,以在Solr中查看图像。
目前,1)我使用apache Nutch抓取网站,然后运行indexsolr命令将数据发送到Solr。 2)我添加了
<requestHandler name="/update/extract" class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="fmap.content">text</str>
<str name="lowernames">true</str>
<str name="uprefix">attr_</str>
<str name="captureAttr">true</str>
和
<lib dir="/path-to-solr/example/solr/collection1/extract" regex=".*\.jar" />
(我创建了一个文件夹提取并从那里的solar dist文件夹移动所有的罐子以及tika相关的罐子) 到solrconfig.xml
3)将以下字段添加到schema.xml中
<field name="host" type="string" stored="false" indexed="true"/>
<field name="segment" type="string" stored="true" indexed="false"/>
<field name="digest" type="string" stored="true" indexed="false"/> enter code here
<field name="boost" type="float" stored="true" indexed="false"/>
<field name="tstamp" type="date" stored="true" indexed="false"/>
<!-- fields for index-anchor plugin -->
<field name="anchor" type="string" stored="true" indexed="true" multiValued="true"/>
<!-- fields for index-more plugin -->
<field name="type" type="string" stored="true" indexed="true" multiValued="true"/>
<field name="contentLength" type="long" stored="true" indexed="false"/>
<field name="lastModified" type="date" stored="true" indexed="false"/>
<field name="date" type="date" stored="true" indexed="true"/>
<field name="aperture" type="double" indexed="true" stored="true"/>
<field name="exposure" type="string" indexed="true" stored="true"/>
<field name="exposure_time" type="double" indexed="true" stored="true"/>
<field name="focal" type="string" indexed="true" stored="true"/>
<field name="focal_35" type="string" indexed="true" stored="true"/>
<!-- for indexing and parsing metadata plugin -->
<field name="metatag.description" type="string" stored="true" indexed="true"/>
<field name="metatag.keywords" type="string" stored="true" indexed="true"/>
看起来我仍然缺少某些东西,因为我看不到Solr中的图像。
我是否需要通过以下方式明确添加每个图像:
curl "http://127.0.0.1:8983/solr/update/extract?literal.id=n1&commit=true" -F "myfile=@my_image.jpg"
? 感谢