除了我的数据的总大小之外,如果我将数据保存在大量表中或合并到一个大表中,它会有所不同吗?几乎没有数据的小表对性能有影响吗?
答案 0 :(得分:0)
与任何数据库一样,由于需要处理数据,在具有更多数据的表上运行查询会更慢。 Amazon Redshift尤其如此,因为它不使用索引 - 而是读取所有数据(但可以通过使用salesorderid customerid totaldue salesorderid customerid totaldue
43793 11000 3756.989 43793 11000 3756.989
51522 11000 2587.8769 43793 11000 3756.989
51522 11000 2587.8769 51522 11000 2587.8769
**51522 11000 2587.8769 57418 11000 2770.2682**
57418 11000 2770.2682 57418 11000 2770.2682
57418 11000 2770.2682 43793 11000 3756.989
来加快SORTKEY
条款的速度,从而加快速度。{ / p>
某些Amazon Redshift用户将数据保存在单独的表中,例如每月一个表。然后,他们创建一个WHERE
,将12个月表合并在一起。这样,查询只能在当前月份的表格上运行(这会更快),或者在12个月的数据中运行。
表(大或小)不会影响不涉及的查询。