使用DIH将数据从csv文件导入Solr核心

时间:2016-02-21 20:32:50

标签: csv solr solrj dataimporthandler dih

我正在尝试使用DIH(日期导入处理程序)将csv文件内容上传到SOLR。我编写了自定义数据配置文件,并将其包含在solr-config.xml中。数据配置文件的内容如下所示:

<dataConfig>
<dataSource name="ds1" type="FileDataSource" encoding="UTF-8"/>
<document>
<entity name="entryline"
                    processor="LineEntityProcessor"
                    url="testSolr.csv"
                    rootEntity="false"
                    dataSource="ds1" header="true"
                    separator="^" transformer="DateFormatTransformer" loglevel="debug">
    <field column="id" name="id"/>
    <field column="ab" name="ab"/>
    <field column="bc" name="bc"/>
    <field column="tt" name="tt" dateTimeFormat="EEE MMM dd HH:mm:ss yyyy" locale="en"/>
</entity>
</document>
</dataConfig>

这里的问题是,Solr能够从csv获取所有行但不能将这些行添加/更新到其核心(请注意,我还有上面提到的属性的schema.xml)。下面是执行导入命令后solr仪表板的快照:

执行导入命令后的Solr仪表板快照:

enter image description here

我也没有得到任何例外。任何人都可以帮助我理解问题或为此提供解决方案。提前谢谢。

1 个答案:

答案 0 :(得分:0)

在实体中使用baseDir。

&#13;
&#13;
<dataConfig>
  <dataSource type="FileDataSource"/>
  <document>
    <!-- this outer processor generates a list of files satisfying the conditions specified in the attributes -->
    <entity name="f" processor="FileListEntityProcessor" fileName="SoapHeader_.*|atom.xml$" recursive="true" rootEntity="false" dataSource="null" baseDir="D:\Apache\Apache-Solr-5.1\example\exampledocs">
&#13;
&#13;
&#13;