Question

我有一个文本文件，其中包含每行的一些数据。每行可以被认为是一个数据库记录，该记录中的字段由分号分隔。我们将文件中的每一行视为单独的文档以用于索引目的。例如，请考虑文件中的以下几行：

1.0.5.32;1.0.5.47;aus;vic;richmond;broadband;-1;-37.8186;144.999;3121;36;28389;43552;3;au;21;0;100;100;100;100;+1100;y;
1.0.5.48;1.0.5.63;aus;vic;melbourne;broadband;-1;-37.8143;144.963;3000;36;28389;5601;3;au;5;0;100;100;100;100;+1100;y;

在上面的示例中，我们有2个要编制索引的文档，每个文档有22个字段。

是否可以在Solr中加载此文本文件并将每一行索引为单独的文档，Solr根据分隔符（在本例中为分号）解析每个文档并提取字段？

如果没有，有没有办法预处理文档以将其转换为Solr理解的形式？

Answer 1

了解Solr Wiki，您的案例在此处有详细描述 http://wiki.apache.org/solr/UpdateCSV

在Solr中加载时是否可以解析文本文档？

1 个答案: