新的模糊查找

时间:2015-01-17 17:48:12

标签: ssis

我是SSIS模糊组设施的新手。假设我有一百万条记录,我想每天清理一次。其中一些记录可能会改变,例如姓氏或出生日期不正确。每天还会创建新记录。我有两个问题:

  1. 每次运行SSIS包时输出表(包含:key_out和key_in的表)是否被截断?或者它是否从上次运行时保持不变?
  2. 如果它保持不变,那么有没有办法只匹配新记录以节省时间?如果您只输入新记录,那么以前匹配的所有记录都会保留在匹配在一起的输出表中,还是会丢失它们?

1 个答案:

答案 0 :(得分:0)

对问题#2的回答:

您可以使用Lookup Transformation

•"如果参考数据集中没有匹配的条目,则不会发生连接。默认情况下,查找转换会将没有匹配条目的行视为错误。但是,您可以配置查找转换以将此类行重定向到无匹配输出。有关更多信息,请参阅查找转换编辑器(常规页面)和查找转换编辑器(错误输出页面)。"

•"如果引用表中有多个匹配项,则Lookup转换仅返回查询查询返回的第一个匹配项。如果找到多个匹配项,则仅当已将转换配置为将所有引用数据集加载到高速缓存中时,查找转换才会生成错误或警告。在这种情况下,当转换检测到多个匹配时,查找转换会生成警告,因为转换会填充缓存。"

https://msdn.microsoft.com/en-us/library/ms141821.aspx