什么是大数据的最佳流

时间:2015-12-01 10:04:02

标签: hadoop hdfs bigdata sqoop

我想在我的Oracle DB for BI上进行数据分析。现在我的流程如下:

源数据库(Oracle) => 使用Sqoop转换为HDFS文件 => 使用Spark查询HDFS文件 => 在Hadoop中写出Spark作为csv文件的放置 => 使用Sqoop转换为目标Oracle DB => 显示输出数据

这是一种有效的方法吗? 如果没有,请详细推荐最有效的方法

1 个答案:

答案 0 :(得分:0)

您可以通过在oracle中定义为外部表来使用Hive表。然后,您可以将表集成到任何BI工具中。 https://docs.oracle.com/cd/E37231_01/doc.20/e36961/sqlch.htm#BDCUG265