Apache Solr PDF索引

时间:2011-09-08 10:22:52

标签: apache solr

我希望在应用程序上传文档时对pdf文档编制索引。在建立索引时,我发送filenamefileType中的url,如下所示

http://localhost:8983/solr/update/extract?stream.file=/D:\apache-solr-3.3.0\example\exampledocs\Accessing_MySQL_from_IntalioBPMS.pdf&stream.contentType=application/pdf&literal.id=111&literal.fileName=Test.pdf&literal.fileType=pdf&commit=true

我的fileName文件中也有fileTypeschema.xml字段。

在我对pdf文档编制索引后,我进行了搜索,它只显示了content文档的idpdf,但没有显示filenamefiletype

我做错了什么?

1 个答案:

答案 0 :(得分:1)

定义架构时,必须指定将存储哪些字段(或在搜索时可检索)。在这种情况下,您的文件名和文件类型字段可能仅被编入索引而不会被存储。

确保您的架构如下所示:

<field name="filename" type="{yourDesiredType}" indexed="true" stored="true" /> <field name="filetype" type="{yourDesiredType}" indexed="true" stored="true" />

有关修改schema.xml的详细信息,请转到http://wiki.apache.org/solr/SchemaXml