数据质量服务内部行为

时间:2012-06-29 14:41:58

标签: sql sql-server tsql sql-server-2012 data-quality-services

在DQS上创建知识库时,我们只能从下拉列表中选择SQL Server和Excel。

我想查询oracle。 为此,我考虑在SQL Server上创建一个从Oracle链接服务器中选择的视图,但我担心性能。

让我们说我的表有10k行,我不介意运行查询对返回10k行的链接服务器的影响,只要它只运行ONCE。

我的问题是:DQS是否一次性加载了执行清理操作所需的所有数据,还是在清理过程中是否继续向数据源(在我的示例中为oracle)提交查询?

2 个答案:

答案 0 :(得分:2)

您需要将Oracle数据导出为可导入DQS的格式。这是清洁项目的一次性数据导入。我在DQS上做了一系列简短的(每次<5分钟)screencasts - 这可能会对你开始时有所帮助。

此外,请在开始使用DQS之前安装CU1,因为更新会大大提高性能。

答案 1 :(得分:0)

是的,SQL中的视图指向链接服务器上的ORACLE“欺骗”DQS认为本地数据在SQL中。数据被访问一次并复制到DQS数据库并在那里进行处理。

我建议安装2012 SP1而不是CU,因为那里有更稳定/经过测试的更新。安装SP1后,您需要运行

DQSInstaller.exe –upgrade

默认安装中的此文件位于

C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn