我需要使用数据湖存储中的数据并在电源BI中显示。数据大小很大,可能是20 GB或50 GB,我不知道功能会有多大。我也不能使用Azure DW和Azure Analysis服务。
现在我提出了一个解决方案我应该在azure数据湖商店中创建一个表格文件(数据透视表),其中聚合日期与数据中的所有表连接一样
地理名称产品名称Salesyerar2015 Salesyerar2017 userId
我需要在电源BI报告中显示两年的数据。
月份级别我有24列措施。在权力我使用数据湖商店的导入数据。
如果数据大小更多我建议使用更高数据文件的BI BI,因此它应该适应缓存(50 GB限制)
现在对于小数据集,它工作正常,我无法测试大文件。
现在我想知道什么时候我有日期级别的表格文件是如何我在表格模型中容纳的。
我也想知道这个提议的设计是正确的,还是我们有其他方法来处理这个用例。
此致 和Manish
答案 0 :(得分:0)
我建议您查看Azure Data Lake Analytics服务中现成的U-SQL抽样功能,以将数据集减少到Power BI可以使用的大小。这是我们经常使用的一种技术。
示例U-SQL:
@Output =
SELECT
*
FROM
@ParsedJSON
SAMPLE UNIFORM
(0.04); //4%
然后将文件输出到数据湖商店以供消费。
希望这有帮助