我准备了一个主Excel文件,它通过Power Query从几个较小的Excel工作表中提取数据,所有这些工作表都包含相同的数据集(相同的列) - 每个员工一个。
今天我注意到,对于一些员工来说,一些数据在主表中是重复的,即使在他们单独的工作表中不存在所述重复项。
主查询由单独的"仅连接"组成。查询,指向每个单独的文件。无论我单击“全部刷新”,“管理数据模型”多少次,重复项仍然保留在那里。
有没有人遇到类似的事情,或者你有什么想法可能是背后的原因以及如何解决它?
谢谢!
答案 0 :(得分:0)
您还没有真正提供有关您的设计的足够信息,但我猜测您正在使用合并查询步骤来组合"较小的Excel工作表" ?如果是这样,那么典型的问题是您没有在“合并查询步骤”定义中指定要匹配的正确列。
如果您在合并的至少一侧选择的列组合不是唯一的,则重复的行将出现在后续的展开步骤中。
找到这些的方法是依次针对每个源表启动一个新查询,选择要匹配的列并使用Keep Rows / Keep Duplicates。您应该看不到任何行 - 任何显示的行都是您的重复项的来源。
我通常保存这些查询并将其作为自动化测试包含在刷新中。我将它们放在一个单独的查询组中,例如"测试 - 应返回0行"。