我想如果有人能解释我是什么让Apache Pig成为一个ETL工具,反之亦然。我知道ETL意味着,提取,转换和加载数据,Pig这样做,但其他平台如Flink,Spark和R(你获取数据,执行一些操作并将其加载到其他地方),我找不到任何说这些工具的信息也被认为是ETL。也许我错过了什么?也许我不完全了解ETL的含义是什么?感谢。
答案 0 :(得分:0)
正如您所说的ETL工具意味着,该工具可用于提取,转换和加载数据。对于ETL工具,我们将有一个用于可视化开发的UI,例如:Informatica / Datastage。我不确定我们是否可以将PIG作为ETL用途的“工具”。但肯定可以用于ETL过程.PIG / HIVE是用于此目的的客户端库。