我在ec2中设置了一个6节点集群。我试图扫描一个100M行的表--2000个分区。我写了一个客户端,启动20-50个线程来读取表格 用于键中的partitionkey select * from table where partitionkey =?
每个查询都是由线程执行的任务。当我在我的mac中运行我的应用程序时,它比在ec2中运行m3.2xlarge框快2倍。
我还注意到,当我在我的mac中运行应用程序时,流量是均匀分布到6个节点的。但是,当我的应用程序在ec2上运行时,几乎有一半的流量进入一个节点。我试图设置池选项以限制与一个主机的连接,但它没有帮助。
任何人都有理想吗?提前谢谢。
答案 0 :(得分:0)
我将broadcast_rpc_address设置为公共IP,可以使用私有IP在aws中设置客户端。