我对柱状数据库比较新,请原谅无知。可以说我有1,000,000列。我想返回10%这些列的随机样本(即c0,c10,c20 ...... c999,980,c999,990)
在HBase中他们有列过滤器,我可以编写一个列过滤器,每隔十分之一返回一次。我可以在Pycassa / Cassanda做这个吗?
谢谢
答案 0 :(得分:0)
你可以轻松地与Pycassa一起做客户端,但Cassandra不支持服务器端过滤。
答案 1 :(得分:0)
你唯一能做服务器的就是切片。所以你可以从column = C10 limit = 10开始读取第10-19列。或者您可以询问特定的列,因此如果您知道有多少列,则可以手动请求每个第10列。