我正在考虑使用Cassandra来存储我目前拥有的XML格式的50M +文档。我一直在寻找,但我似乎无法找到任何我真正可以遵循的关于如何将这些数据批量加载到Cassandra而无需编写一些Java(我的语言技能列表不高!)。
我很乐意编写一个脚本来将这些数据转换成任何格式,如果它可以使加载更容易,虽然CSV可能会很棘手,因为文档的主体几乎可以包含任何内容!
欢迎任何建议。
由于
的Si
答案 0 :(得分:2)
如果您愿意将XML转换为某种分隔格式(即CSV),那么这里有几个选项:
cqlsh
中的COPY
command。在最近的Cassandra版本中,这实际上有一个很大的performance boost。cassandra-loader
utility。这样更灵活,并且有许多不同的选项,您可以根据文件格式进行调整。如果您愿意编写除Java之外的其他代码(例如,Python),那么对于一堆编程语言来说有Cassandra drivers available。如果你有另一种语言,你就不需要学习Java。