需要处理cassandra中的所有记录

时间:2014-05-21 12:24:01

标签: cassandra

我设计了一个软件来存储来自全球数百家新闻机构的新闻。我还创建了一个URL来从我的应用程序访问它们,如下所示:
http://www.myweb.com/news/health/1234567
现在我想将此格式更改为其他内容,但我需要创建一个重定向模块来处理来自Google的用户的旧URL请求,因此我需要读取数百万条记录并进行转换。
据我所知,不可能阅读Cassandra中桌子的所有记录。我该怎么做呢?

1 个答案:

答案 0 :(得分:0)

我猜猜在这种情况下ALTER TABLE不适合你?

DataStax Java驱动程序2.0提供自动结果集分页。 我可能一次批量读取所有行,并将更改写入新表,然后删除旧表。可能是周末或晚上的工作。

"允许您无限期地在ResultSet上进行迭代,逐行获取行,直到客户端可用的行耗尽为止。这样可以更容易地操作大型结果集,同时还可以屏蔽客户端应用程序,使其无法实现意外大的ResultSet对象。"

http://www.datastax.com/documentation/developer/java-driver/2.0/java-driver/whatsNew2.html

示例CQL:

http://www.datastax.com/dev/blog/client-side-improvements-in-cassandra-2-0

对于Astyanax车手:

https://github.com/Netflix/astyanax/wiki/AllRowsReader-All-rows-query

干杯,