提取DataStage作业性能统计信息(开始和结束时间)

时间:2012-11-19 20:29:30

标签: performance etl datastage

DataStage版本是8.1 - 我没有直接访问权限,但需要提供说明以便为我提取一些作业运行时统计信息。我相信存储库位于DB2数据库中,或者可能位于平面文件中,如果8.1中仍然支持它。我无法在那里安装任何工具。

有一个包含几十个作业的主序列。其中一些是平行的。序列本身一次运行一个,并在白天不断运行。

在24小时内,我需要提取此主序列的性能统计数据。这样的事情:

job_name, start_time, finish_time, completion_status

我真的只需要时间信息。我可以使用任何格式,但我最终真正追求的是一个csv风格的文件,其时间如上所述。

我在dsjob -report上得到了一些提示,但我没有足够的背景在DataStage中提供良好的指令。希望能够再次访问自己,我是DataStage的小伙伴。

提前致谢。

2 个答案:

答案 0 :(得分:2)

您可以将作业上次运行的元数据导出到XML文件。

#!/usr/bin/ksh

project="yourProjectName"
job="yourJobName"

dsjob -report $project $job XML >"$project_$job.xml"

答案 1 :(得分:1)

您可以使用Director导出序列日志,并在作业启动和完成时进行解析。或者,您可以通过命令行导出日志(请参阅dsjob -logsum命令),然后在awk中进行解析(如果在UNIX或AIX系统上)。

如果您能够修改序列,则可以添加活动阶段并在序列中的作业之前和之后写入文件。