我已经在Azure中创建了Datalake Analytics,并在其下添加了2个ADLS作为数据源-其中一个是默认值。以下是我目前正在寻找的两种情况,而其中一种情况却失败了:需要帮助以了解为什么我们无法访问我的Analytics(分析)中的另一个Datalake存储。
方案1 :(默认数据源)-起作用
输入文件:ADLS1 / Input.csv
输出文件:ADLS1 / Output.csv
方案2:错误。
输入文件:ADLS2 / Input.csv
输出文件:ADLS2 / Output.csv
错误:找不到文件或数据存储没有读取权限。
这是我的代码:
SET @@FeaturePreviews = "DataPartitionedOutput:on";
DECLARE @InputFile string = @"adl://testprojectadls.azuredatalakestore.net/Data.csv";
DECLARE @OutputFile string = @"adl://test.azuredatalakestore.net/output3/parquetfiles-{Hour}.csv";
@Data=
EXTRACT
Hour string,
Month string,
Year string,
Message string,
Sample_trace string
FROM @InputFile
USING Extractors.Csv(skipFirstNRows:1);
@result =
SELECT Hour ,
COUNT(*) AS total,
ANY_VALUE(Message) AS sample_message,
ANY_VALUE(Sample_trace) AS sample_trace
FROM @Data
WHERE Year == "2018"
AND Month == "5"
GROUP BY Hour
HAVING COUNT(*) > 0;
OUTPUT @result
TO @OutputFile
ORDER BY Hour DESC,
total DESC
USING Outputters.Csv(outputHeader : true);