目前,我们的一个表大小是5亿行(有35列),我们正在尝试确定,在影响我们在该表上运行查询的性能之前,我们的表有多大?
答案 0 :(得分:1)
无法像行*列那样衡量效果。
它取决于数据类型,连接,聚合等。您的查询性能可以大大提高,例如,通过创建int键(添加列)而不是char / varchar键(如果在连接中使用)。
答案 1 :(得分:1)
@vtuhtan的答案的一个重要补充:启用压缩。创建为各种数据类型启用压缩的表 - lzo,runlength等.Redshif在具有ANALYZE COMPRESSION
SQL命令的表上也建议使用正确的压缩类型。这会降低读取吞吐量并显着提高查询性能。这也将使表占用更少的存储空间。