合并Data Lake存储中的文件

时间:2017-06-29 13:41:22

标签: azure-data-lake u-sql

我有一个包每天将文件导入Data Lake商店。这是具有不同值(相同列等)的相同文件。我的想法是将这些文件合并到Data Lake上的单个文件中,以便进行月度报告。我想调查U-SQL,所以我的问题是:
这可能与U-SQL有关吗? 如果不可能有其他选择吗?

1 个答案:

答案 0 :(得分:3)

很容易合并两个文件中的记录并编写新文件。以下是步骤

  1. 使用EXTRACT
  2. 阅读所有新文件
  3. 使用EXTRACT
  4. 读取当前主文件的所有记录
  5. 使用UNION ALL合并记录:https://msdn.microsoft.com/en-us/library/azure/mt621340.aspx
  6. 使用OUTPUT语句将输出写入主文件
  7. 有关快速U-SQL教程,请访问:https://docs.microsoft.com/en-us/azure/data-lake-analytics/data-lake-analytics-u-sql-get-started