当我运行python脚本以使用
从Cassandra获取数据时SELECT * FROM my_keyspace LIMIT 5000000;
使用500万的限制,然后在22分钟的处理时间后显示记录。但是当我将限制设置为1000万条记录并触发查询时,脚本会等待很长时间,我还没有收到回复。可能是什么问题?
答案 0 :(得分:1)
您没有在查询中指定分区键,因此协调器节点应该请求所有节点获取数据。协调器也会在将结果传递给python脚本之前收集所有数百万行,并且它可能会导致协调器上的大量垃圾收集调用。
您应该避免没有分区键的查询没有性能问题。
请查看Cassandra Read Path了解详情。