我怀疑猪/ cassandra负荷。
使用pig使用CqlStorage从cassandra加载数据。像这样
data = LOAD 'cq://ks/cf' using CqlStorage();
我想通过过滤加载少量数据,我想要过滤的列是分区键,这个https://issues.apache.org/jira/browse/CASSANDRA-6151中有错误,所以我不能这样做。
因此计划过滤猪,b = filter data by col1 == 'something';
我的疑问是,猪是否从cassandra加载所有数据然后过滤?或者它会向CqlStorage发送过滤条件以仅从cassandra加载所需的数据。