第二代ADLS的Power BI和实木复合地板

时间:2020-02-05 23:52:20

标签: powerbi parquet powerbi-desktop

我能够从Power BI Desktop连接到ADLS Gen2并处理CSV文件。

问题在于,Parquet格式无法使用相同的功能。 您曾经在Power BI Desktop上使用过镶木地板吗?

当添加镶木地板表后,我单击二进制参考时出现问题-Power Query无法读取/预览镶木地板数据。我尝试了和没有快速压缩。

我也尝试手动编写查询:

let
    Source = AzureStorage.DataLake("https://xxx.dfs.core.windows.net/yyy/data.parquet"),
    #"File" = Source{[#"Folder Path"="https://xxx.dfs.core.windows.net/yyy/data.parquet",Name="data.parquet"]}[Content],
    #"Imported File" = Parquet.Document(#"File")
in
    #"Imported File"

但是有以下例外情况:

无法识别名称“ Parquet.Document”。确保拼写正确 正确。

尽管Parquet.Document功能为Intel Intrinsics Guide - max。我正在使用Poewr BI Desktop的最新版本(2019年12月)。

P.S。从Visual Studio SSDT开发用于AAS的DAX模型时,我也遇到了相同的问题。

3 个答案:

答案 0 :(得分:1)

当前,您不能在Power BI Desktop中直接使用镶木地板文件。您首先需要利用Azure Data Factory's wrangling data flows之类的东西来转换为CSV或其他消耗格式。

您所指的功能似乎是专门为this new feature in Azure Data Factory添加的,它允许在处理数据流时使用Parquet文件。

Power BI Service的数据流也可能很快出现,但这只是我的推测。

答案 1 :(得分:1)

Power BI 现在原生支持此功能。

enter image description here

只需将 URL 粘贴到您的湖泊/存储帐户上的镶木地板文件中,您就可以开始使用了。显然,这不会在 March 2021 之前上线,但我认为它会出现在 2020 年 12 月的版本中。

答案 2 :(得分:0)

我已经能够通过Power BI Dataflow成功读取存储在ADLSG2中的实木复合地板文件。

不幸的是,您无法通过gui来完成操作;在撰写本文时,没有将本木地板格式本机检测为源数据类型。要解决该问题,只需使用高级查询编辑器(为了进入高级编辑器,只需选择JSON或替代数据类型,然后在高级查询编辑器中覆盖M代码即可。)

注意:当前不适用于2020年6月发行的PowerBI Desktop。据我所知,它只能通过数据流来工作:

let
  Source = AzureStorage.DataLake("https://xxxxxxxxxx.dfs.core.windows.net/Container"),
  Navigation = Parquet.Document(Source{[#"Folder Path" = "https://xxxxxxxxxx.dfs.core.windows.net/yourcontainer/yoursubfolder/", Name = "yourParquetFile"]}[Content]),
  #"Remove columns" = Table.RemoveColumns(Navigation, Table.ColumnsOfType(Navigation, {type table, type record, type list, type nullable binary, type binary, type function}))
in
  #"Remove columns"