U-SQL表中的聚簇索引是否会影响并行性?

时间:2017-05-16 12:23:49

标签: azure-data-lake u-sql

我们正在使用U-SQL表,并且有关于Clustered Index的问题。在U-SQL表中,并行性由数据的分区和分布方式管理。群集索引是否也会影响U-SQL表中的并行性?其次,它如何管理分发桶中的数据偏差?

1 个答案:

答案 0 :(得分:0)

聚簇索引本身并不影响并行性,但如果使用索引搜索或索引扫描读取数据,则可能会影响,具体取决于查询谓词。因此它会影响访问顶点内数据的性能。

不管理数据偏差。如果您有偏差,则必须找到更好的分配密钥,使用偏差提示或使用ROUND ROBIN分发。