应用错误收集

我正在尝试使用350-400列创建cassandra表，可能还有4-5亿条记录。问题是为了实现RDBMS样式查询需要注意什么。我理解表必须按照查询要求设计。由于它将有350-400列，我确定如何选择主键我的查询将需要太多的二级索引。如果不是这样，那么我该如何设计表格。我是否使用spark将数据上传到多个子表中？或者我是否在该大表上创建物化视图？如果没有，可用的其他解决方案是什么。

此外，如果有2个或3个这样的大文件，它们之间有关系，我如何设置表格，以便我可以运行使用两个表格中的数据的查询。

由于汤姆

cassandra表和数据模型

0 个答案: