我们每天几乎都会收到新数据,这些数据保存在本地文件夹中。我已经在Power Query中从这些数据创建了一个数据模型来处理和创建可视化,只要刷新,该可视化将再次遍历整个文件夹。如您所料,这可能会非常缓慢,特别是因为我的模型处理了大量数据处理。
无论如何,我是否可以配置Excel Power Query,所以无论何时刷新,它只会加载以前未加载的文件,而其他都保持原样?
先谢谢您
答案 0 :(得分:0)
一种方法是仅提取最新文件
let Source = Folder.Files("C:\Temp"),
#"Sorted Rows" = Table.Sort(Source,{{"Date modified", Order.Ascending}}),
Path = #"Sorted Rows"{0}[Folder Path] & #"Sorted Rows"{0}[Name]
in Path
另一种方法是保留要处理的文件名的累积表,并使用合并将这些文件名过滤出目录文件列表。有关创建excel历史记录表的提示,请参见Excel history table以获得对此更好的解释之一