我是Solr的新手,我通过存储在我的数据库中的URL从二进制文件中提取元数据。我想知道哪些字段可用于从PDF索引(将作为column =“”启动的字段)。我还想知道如何在Solr中创建自定义字段。如何实现并映射到来自文件的特定元数据。如果有人有一个可以告诉我的代码片段,我将非常感激。 提前谢谢。
答案 0 :(得分:0)
要在Solr中创建自定义字段,您需要修改Solr安装的schema.xml
文件。分发中包含的Solr示例附带的schema.xml文件(位于/ example文件夹下)包含大量用于文件提取的预定义元数据字段。有关在Solr中创建自定义字段的信息,请参阅以下内容:
Solr有一个内置的请求处理程序,用于从二进制文件中提取和映射元数据。有关详细信息,请参阅以下内容: