标签: xml indexing lucene solr
上次我制作了一个solr索引,它开始索引并对空字符串进行分区。这从未发生过。这是正确的行为吗?我应该在DIH中过滤空字符串吗?
感谢。
答案 0 :(得分:1)
是的,我建议在数据导入处理程序中将它们过滤掉(将它们设置为NULL),以减少生成可能较大的构面计数所需的加载时间。当可选值在数据集中表示为空字符串时,这可能会定期出现。