将数据写入数据湖gen2以进行功率双消耗

时间:2020-07-06 18:34:20

标签: azure powerbi azure-data-lake

如果我们有一些来自营销平台的数据,以每小时的价格提供行为数据(请参见CSV文件中的事件或行)。

我想将其放入第2代数据湖中,以使电源开发人员可以轻松使用和使用数据。

作为一名开发人员,我该如何做才能针对Power Bi用户更优化此数据?我应该在时间部分放东西吗?我应该只删除原始CSV文件,希望它不是powerbi的性能问题吗?

我问是因为我看到了Power Platform数据流正在生成的文件,并且想知道是否应该做类似的事情?也许已经有用于C#的工具/ SDK可以做到这一点。在执行某些操作之前,我应该在此任务中考虑什么?

1 个答案:

答案 0 :(得分:0)

我必须说,这个问题非常笼统,很难在不查看数据的情况下提供指导。由于您是在谈论市场营销数据,因此我认为它是海量数据,因此我必须说PBI确实能够很好地处理海量数据。无论如何,问题在于我们如何将数据保存在ADLA第2代中。我建议你可以

容器\年\月\日\小时 例如 * 2020 \ 07 \ 12 \ 23 *

如果可能的话,我可以去

容器\年\月\日\小时\毫米 例如 2020 \ 07 \ 12 \ 23 \ 59

这种方法将使csv文件更小,我认为这总是更好。