我正在加载一些图形数据唱titan API并将cassandra配置为存储后端。我的图表数据有大约100万个顶点。我希望这些数据分布在N个cassandra节点上。
为此,我在同一系统中为每个节点配置了3个节点,127.0.0.1
,127.0.0.2
和127.0.0.3
。 nodetool status的输出显示所有3个IP和负载均等。
我尝试加载图形,但整个数据在所有3个节点中复制(node1中的1M顶点,node2中的1M顶点和node3中的1M顶点)。我希望数据分布在所有3个节点上,例如node1中的1M / 3,node2中的1M / 3和node3中的1M / 3。
DESCRIBE KEYSPACE TITAN
的输出:
CREATE KEYSPACE titan WITH replication = {'class': 'SimpleStrategy', 'replication_factor': '1'} AND durable_writes = true;
nodetool status的输出:
Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns Host ID Rack
UN 127.0.0.1 7.79 MB 1 ? f5a689f0-f4c1-4f68-ab81-58066e986cd4 rack1
UN 127.0.0.2 229.79 KB 1 ? b6940e7e-b6eb-4d1f-959e-b5bd0f5cea15 rack1
UN 127.0.0.3 7.11 MB 1 ? a3244b16-a73c-4801-868f-05de09615ed9 rack1
有人可以分享正确配置的详细信息以分担负载。如有任何问题,请纠正我。
谢谢, 哈