我正在尝试使用350-400列创建cassandra表,可能还有4-5亿条记录。问题是为了实现RDBMS样式查询需要注意什么。我理解表必须按照查询要求设计。由于它将有350-400列,我确定如何选择主键我的查询将需要太多的二级索引。如果不是这样,那么我该如何设计表格。我是否使用spark将数据上传到多个子表中?或者我是否在该大表上创建物化视图?如果没有,可用的其他解决方案是什么。
此外,如果有2个或3个这样的大文件,它们之间有关系,我如何设置表格,以便我可以运行使用两个表格中的数据的查询。
由于 汤姆