我有一个数据流任务,它执行一些脚本组件任务,排序,然后执行合并连接。我想让合并加入作为一个多人加入。如果我进行内部联接,我的记录太少:
如果我进行左外连接,我会得到太多记录:
我正在寻找'Just Right'的Goldilocks版本(这将是39240条记录)。
答案 0 :(得分:2)
您可以在合并加入的左连接版本之后添加条件拆分,并使用不匹配的条件,例如
isnull(tmpAddressColumn)
并将相关的匹配流量条件(默认输出)发送到目的地。
如果仍然没有得到正确的数字,则需要检查合并连接条件并检查每个来源中是否有重复的ID。
答案 1 :(得分:0)
如果您使用合并连接的正确选项,则行数不应该是您用来衡量的数量。结果数据集应该是驱动因素。结果在tmpManAddress表中看起来是否正确?
对于开发,您可能希望将脚本组件的输出推送到表,以便您可以看到您开始使用的数据。这将允许您计算出哪种类型的连接,以及在哪些列上为您提供所需的结果。