从OLTP Mysql使用Hadoop Hive创建OLAP

时间:2011-08-08 06:06:18

标签: hadoop olap hive oltp

我对用于制作OLAP的Wiki中读取的Hadoop hive感到困惑。 现在我想从使用Mysql的OLTP数据库在Hive上创建OLAP。

我怎么能解决这个问题?我可以使用Kettle在Hive中制作OLAP吗? 任何指导如何从OLTP mysql在Hive上制作OLAP?

韩国社交协会

1 个答案:

答案 0 :(得分:0)

我建议采用以下方法:
a)指定OLTP进程的历史记录部分。通常它是某种操作日志。让我们称之为事实表。
b)将事实表按时间划分 c)通过将最旧的分区导出为CSV并从MySQL中删除来定期从MySQL卸载最旧的分区 e)将此CSV文件加载到Hive

通过实现此架构,您将获得配置单元中除最新数据之外的所有数据,并防止MySQL OLTP数据库的增长。