使用猪从cassandra加载所需的数据

时间:2014-02-21 08:27:07

标签: hadoop cassandra apache-pig

我怀疑猪/ cassandra负荷。

使用pig使用CqlStorage从cassandra加载数据。像这样

data = LOAD 'cq://ks/cf' using CqlStorage();

我想通过过滤加载少量数据,我想要过滤的列是分区键,这个https://issues.apache.org/jira/browse/CASSANDRA-6151中有错误,所以我不能这样做。

因此计划过滤猪,b = filter data by col1 == 'something';

我的疑问是,猪是否从cassandra加载所有数据然后过滤?或者它会向CqlStorage发送过滤条件以仅从cassandra加载所需的数据。

0 个答案:

没有答案