Azure数据工厂复制活动非常慢

时间:2020-11-02 05:42:50

标签: azure azure-data-factory

总结问题

我发现Azure数据工厂的性能特别慢。在StackOverFlow上搜索类似的问题,除了与支持人员联系的建议外,什么都没有。 我在这里掷骰子,看看是否有人看过类似的东西并知道如何解决。

简而言之,我尝试在ADF中执行的每项操作都会导致性能异常下降。 这包括:

  • 将blob存储中的zip提取到blob存储中
  • 将许多小的压缩文件复制到Azure数据浏览器中
  • 将许多未压缩的小json文件复制到Azure数据浏览器中

Extracting ZIP

Copying to ADX

在两种情况下,性能均以千字节/秒为单位。 在这两种情况下,复制/导入最终都将起作用,但是可能要花几个小时。

描述您尝试过的事情

我尝试过:

  • 使用不同的地区
  • 创建和使用自己的集成运行时
  • 使用不同的参数可能会影响性能,例如并行连接等。
  • 联系Microsoft支持人员(谁将我发送到这里)

显示一些代码

几乎没有任何要共享的代码。要重现,只需尝试从Blob存储中提取拉链即可。我得到〜400KB / s。

总而言之,我们将不胜感激任何建议。如果我无法正常工作,则必须手动实现一个摄取工厂,该工厂在反射时听起来比我使用ADF时还有趣。

1 个答案:

答案 0 :(得分:0)

该“深度”文件夹将影响复制速度。我们应该最小化深度并增加复制活动的数量。您可以参考此document来解决复制活动的性能问题。或者,您可以将feedback发送到Microsoft Azure。