我想为exampledocs
目录中的某些XML文件添加标题。例如,manufacturers.xml
文件包含<doc>
个标签中的11行数据,但我看到的几乎每个表都有一个标题,可能类似于“表1.为个人提供免费回收的计算机制造商列表消费者购买等等等等......“
我是否需要添加一个新的字段名称=“caption”并重复11次(可能非常长)或者是否有更好的方法在Solr中添加标题?
答案 0 :(得分:0)
如果您想在示例文档中使用名为“caption”的字段,那么是的,您需要在那里添加它们(还有其他方法可以添加这样的字段,但是更多的工作,我认为您不想追求这一点)。
查看format
但是,为了确保,如果你有一个数据库并需要索引某些表等,通常的方法是使用DIH,或者使用SolrJ api以编程方式进行。你知道吗?
编辑:阅读完评论后......你应该看看DIH and Tika