应用错误收集

如何加速Redshift查询

时间：2014-11-13 11:09:59

标签： psql amazon-redshift

我正在使用json_extract_path_text函数从JSON中提取值。随着行数据的增加，查询需要很长时间才能运行并且会在一段时间内失败。

有没有办法减少查询执行时间或改进josn_extract_path_text函数

2 个答案:

答案 0 :(得分：1)

解决方案是：以表格格式而不是JSON格式存储数据。 JSON不是存储大型数据集的好选择，因为通过将不同的数据存储在单个列中，JSON不会利用Amazon Redshift的列存储架构。或者将节点类型更改为更大的节点类型。

答案 1 :(得分：-1)

Redshift是一个柱状存储，以JSON格式存储数据不会加快查询速度。这适用于文档模型NOSQL数据库，但不适用于RedShift。为了使RedShift查询更有效，基于您拥有的集群数量，表格的分配方式（即使对于数据不遵循特定顺序或随机的方案）也很重要。此外，主键列上的分配键（在其他RDBMS模型中）和相同的排序键可以帮助您加入（它将使用排序合并连接而不是更长的哈希连接）。

有关此内容的更多详细信息，请查看文档。 RTFM是你的朋友。