在Solr中加载时是否可以解析文本文档?

时间:2013-11-25 20:05:18

标签: solr

我有一个文本文件,其中包含每行的一些数据。每行可以被认为是一个数据库记录,该记录中的字段由分号分隔。我们将文件中的每一行视为单独的文档以用于索引目的。例如,请考虑文件中的以下几行:

1.0.5.32;1.0.5.47;aus;vic;richmond;broadband;-1;-37.8186;144.999;3121;36;28389;43552;3;au;21;0;100;100;100;100;+1100;y;
1.0.5.48;1.0.5.63;aus;vic;melbourne;broadband;-1;-37.8143;144.963;3000;36;28389;5601;3;au;5;0;100;100;100;100;+1100;y;

在上面的示例中,我们有2个要编制索引的文档,每个文档有22个字段。

是否可以在Solr中加载此文本文件并将每一行索引为单独的文档,Solr根据分隔符(在本例中为分号)解析每个文档并提取字段?

如果没有,有没有办法预处理文档以将其转换为Solr理解的形式?

1 个答案:

答案 0 :(得分:1)

了解Solr Wiki,您的案例在此处有详细描述 http://wiki.apache.org/solr/UpdateCSV