Python脚本没有响应大量的Cassandra查询

时间:2016-04-19 12:20:33

标签: python cassandra limit

当我运行python脚本以使用

从Cassandra获取数据时
  

SELECT * FROM my_keyspace LIMIT 5000000;

使用500万的限制,然后在22分钟的处理时间后显示记录。但是当我将限制设置为1000万条记录并触发查询时,脚本会等待很长时间,我还没有收到回复。可能是什么问题?

1 个答案:

答案 0 :(得分:1)

您没有在查询中指定分区键,因此协调器节点应该请求所有节点获取数据。协调器也会在将结果传递给python脚本之前收集所有数百万行,并且它可能会导致协调器上的大量垃圾收集调用。

您应该避免没有分区键的查询没有性能问题。

请查看Cassandra Read Path了解详情。