我想稍微测试一下我的集群,数据是如何重复的,等等。
我有一台由5台机器组成的cassandra集群(其中包括centos 7和cassie 3.4)。
是否已经创建了任何可用于测试的表,我可以在某个键空间中导入我的数据库?
如果是,请善待并解释如何将它们导入密钥空间以及从哪里获取它们。
答案 0 :(得分:1)
实际上,互联网上有很多可用于测试的数据
e.g。
https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public
http://bigdata-madesimple.com/70-websites-to-get-large-data-repositories-for-free/
Cassandra提供了用于执行CQL命令的工具cqlsh作为 COPY ,用于将CSV数据导入数据库。
P.S.But注意cqlsh有一些与超时相关的限制这一事实。这就是为什么最好使用一些cassandra连接器来使这个过程更有效。
答案 1 :(得分:1)
你可以使用Cassandra压力。这非常适合为您的表格样式创建数据,并且还有一些默认表格。
http://docs.datastax.com/en/cassandra_win/3.0/cassandra/tools/toolsCStress.html
我强烈推荐它。