我希望在应用程序上传文档时对pdf
文档编制索引。在建立索引时,我发送filename
和fileType
中的url
,如下所示
http://localhost:8983/solr/update/extract?stream.file=/D:\apache-solr-3.3.0\example\exampledocs\Accessing_MySQL_from_IntalioBPMS.pdf&stream.contentType=application/pdf&literal.id=111&literal.fileName=Test.pdf&literal.fileType=pdf&commit=true
我的fileName
文件中也有fileType
和schema.xml
字段。
在我对pdf文档编制索引后,我进行了搜索,它只显示了content
文档的id
和pdf
,但没有显示filename
和filetype
我做错了什么?
答案 0 :(得分:1)
定义架构时,必须指定将存储哪些字段(或在搜索时可检索)。在这种情况下,您的文件名和文件类型字段可能仅被编入索引而不会被存储。
确保您的架构如下所示:
<field name="filename" type="{yourDesiredType}" indexed="true"
的 stored="true"
强> />
<field name="filetype" type="{yourDesiredType}" indexed="true"
的 stored="true"
强> />
有关修改schema.xml
的详细信息,请转到http://wiki.apache.org/solr/SchemaXml。