标签: postgresql hadoop sqoop
在我的应用程序中有4个表,每个表有超过100万个数据 目前,我的基于java的报告引擎连接所有表并获取数据以显示在报告中。
现在我想使用sqoop介绍Hadoop。我安装了hadoop 2.2和sqoop 1.9。
我做了一个小POC来导入hdfs中的数据。问题在于,每次创建新的数据文件。
我的需求是:
会有一个调度程序,它将在白天运行一次,它将:
我对此几乎没有问题:
请在这种情况下帮助我......
如果你有...,请建议我更好的解决方案。
答案 0 :(得分:1)
Sqoop支持增量和delta进口。有关详细信息,请查看Sqoop文档here。