我在PostgreSQL数据库中有数据,我想得到它,对待它并将其保存到HBase DB。是否可以在Map操作中以某种方式分发JDBC操作?
答案 0 :(得分:3)
是的,您可以DBInputFormat
:
DBInputFormat
使用JDBC
连接到数据源。由于JDBC
已广泛实施,DBInputFormat
可与MySQL
,PostgreSQL
和其他几个数据库系统配合使用。各个数据库供应商提供JDBC
驱动程序,以允许第三方应用程序(如Hadoop
)连接到其数据库。
DBInputFormat
是一个InputFormat
类,允许您从数据库中读取数据。 InputFormat
是Hadoop对数据源的形式化;它可以指以特定方式格式化的文件,从数据库读取的数据等。DBInputFormat
提供了一种从数据库扫描整个表的简单方法,以及从任意SQL
个查询中读取的方法针对数据库执行。
答案 1 :(得分:2)
我认为您正在寻找Sqoop,它旨在从SQL服务器导入到HDFS堆栈技术。它将从JDBC连接获取的数据放入HDFS,从而将其分散到Hadoop NameNodes中。我相信这就是你要找的东西。
SQl toOOP = SQOOP,得到它?
Sqoop可以导入HBase。请参阅this link。