映射减少输出到oracle数据库?

时间:2013-11-04 13:58:46

标签: java oracle hadoop mapreduce

我们正在开发一种网络监控工具,可以持续监控和收集来自配置系统的CPU使用率%,内存使用率%数据。我们目前将数据放入oracle db。我们的目的是根据数据生成图形报告。例如,过去12小时的CPU使用情况将显示包含12个绘图点的线图。间隔为1小时。 然而,表现有点慢。我们的计划是增加密谋。也就是说,我们以10秒的间隔绘制图形。 ,30秒,...随着oracle查询它似乎更难。

因此我们计划使用hadoop存储时间序列监视数据,并使用map减少作业以获得不同时间间隔的平均值。我认为一个选项是直接从hdfs读取输出。它使我们的程序员重写了graphloading部分。我们可以将此输出写入 oracle 数据库,以便我们可以轻松查询这些数据吗?

2 个答案:

答案 0 :(得分:3)

可以使用sqoop将数据从HDFS移动到数据库。它取消了您必须手动完成的繁重工作。

答案 1 :(得分:3)

您可能需要查看Oracle Loader for Hadoop。它似乎是来自Oracle的免费库,基本上完全符合您的要求。它似乎带有一个OutputFormat,它将直接写入Oracle实例。