Voltdb - Kafka Importer - 用于导入的更改分隔符

时间:2017-02-13 14:38:18

标签: apache-kafka voltdb

我有一个由“;”分隔的kafka主题我想导入到伏特表中。

我没有在官方文档中找到有关更改分隔符的任何内容。 Kafka Importer(https://docs.voltdb.com/UsingVoltDB/exportimportkafka.php)只给我两个选项:CSV和TSV。

是否有任何高级配置允许我只更改分隔符?

我的deployment.xml:

<import>
    <configuration type="kafka" enabled="true" format="csv">
        <property name="topics">br-com-topic-ws</property>
        <property name="procedure">AUT.insert</property>
        <property name="brokers">liXXXX:9092</property>
    </configuration>
</import>

我的Kafka主题示例:

  

000000ADS; 20160202; 20050202235900; 18.99; 99   000000JAM; 20160202; 20150201235900; 18.05; 20

2 个答案:

答案 0 :(得分:0)

KafkaImporter默认使用CSV / TSV导入格式化程序,作为few options,但没有可用于分隔符的可配置选项。

您可以实现自定义解码器来处理其他格式。我们有一些测试代码,其中包含Github here上的示例自定义格式化程序。有一个run.sh包含一个函数jar,它将构建一个包含自定义格式化程序代码的OSGI包。构建使用ant,它使用build.xml文件。

答案 1 :(得分:0)

我建议您实现自己的导入格式化程序,请参阅示例here

配置它使用此示例deployment file