数据阶段并行与性能提升

时间:2018-10-29 17:11:39

标签: datastage

Datastage并行性如何帮助提高性能?并行性和性能之间是什么关系?

感谢与问候, Subhasree

1 个答案:

答案 0 :(得分:0)

这个问题非常广泛-下次请尝试不具体。

DataStage中有几种不同的并行方法:

  1. 管道并行性:想象一下一项工作,其中将从数据库读取的数据进行转换并将其写入另一个数据库。虽然仍从数据库读取数据,但某些行已转换,而某些行(已转换)已写入目标。 因为您不必等待单个步骤即可完成操作,所以可以提供出色的性能。
  2. 分区并行:从顺序文件中读取数据,然后将其拆分为不同的数据分区(分区数由配置文件确定)。同样设计一次的并行阶段将在每个分区实例化一个,因此将产生额外的线程。这些线程将并行运行,并再次提供更好的性能(吞吐量)。

希望这会有所帮助。