应用错误收集

是否建议利用Hadoop生态系统并行处理来管理和维护缓慢变化的数据仓库规模？

时间：2019-03-31 12:18:11

标签： hadoop etl data-warehouse data-processing

我们有来自操作系统的每小时交易数据和每日批量加载的数据，我们将该数据工程化为MS SQL Server环境中的数据仓库维度（和事实）。如果被推荐，我们可以应用哪些快速有效的技术（Flume，Sqoop，Kafka，HDFS，HBase，Hive，KUDU，Spark，Impla）在Hadoop中实现？假设这些尺寸将由MS SQL Server数据仓库每小时消耗一次。

1 个答案:

答案 0 :(得分：0)

可能的选项是Nifi或MiniFi

https://nifi.apache.org/

数据仓库 - 缓慢改变具有多对多关系的维度
是否存在数据仓库中缓慢更改FACT的概念
慢慢改变维度 - 确切的SQL查询实现以检索正确的数据
慢慢改变维度 - Hive中的SCD1和SCD2实现
如何从缓慢变化的实体加载数据仓库维度？
如何在缓慢变化的维度和事实中跟踪合并
是否建议利用Hadoop生态系统并行处理来管理和维护缓慢变化的数据仓库规模？
事件源和数据仓库的尺寸变化缓慢

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？