对于任何ETL或数据转换工具,IGC都可以让我追踪数据的来源或使用方式吗?

时间:2019-07-12 19:34:44

标签: ibm-infosphere ibm-governance

作为治理计划和法规要求的一部分,我们需要生成沿袭(易处理性)报告,概述进入仓库的数据流以及使用其数据的报告或服务。我们知道,当DataStage将数据写入仓库时,信息治理目录可以自动生成此类报告。当我们使用SQL脚本或其他工具读取信息或将信息写入仓库时,Information Governance Catalog是否可以执行相同操作?我可以查看包含这些不同信息的完整世袭报告吗?

IGC采取哪些步骤来记录或定义信息的使用以支持数据沿袭和监管报告?

1 个答案:

答案 0 :(得分:0)

是的,尽管我们可以为DataStage自动生成沿袭(可追溯性)报告,但IGC确实提供了工具来记录其他数据移动脚本,工具或流程的数据流。这将产生相同的沿袭报告,可用于满足合规性需求,或建立对数据使用或使用的信心和信任。

最简单的是,IGC允许人们起草一份映射文件。本质上,电子表格描述了数据源和数据目标,以及支持转换,聚合或其他逻辑的文档。该电子表格可以直接在IGC中编写,也可以从Excel(文本文件)加载,从而进一步支持流程的自动化。扩展映射文档的文档可以在这里找到:https://www.ibm.com/support/knowledgecenter/en/SSZJPZ_11.5.0/com.ibm.swg.im.iis.mdwb.doc/topics/c_extensionMappings.html(尽管建议从IGC创建这样的文档,并将结果导出到Excel)。

此外,IGC支持更正式的流程来扩展目录和引入新的资产类型。这将更进一步,并正确记录和分类数据流程(SQL命令,其他ETL工具)并映射通过这些流程的数据移动。这将使用户能够识别数据流程,甚至允许其中包含操作数据(IGC支持)。有关此过程的更多信息,请参见:https://www-01.ibm.com/support/docview.wss?uid=swg21699130

建议检查绝对要求,以及随后的可追溯性报告需要哪些信息。从扩展映射文档开始就足够了,并且将是最简单的实施并带来直接的好处。