我有几个sqlserver
和mysql
db&#39。并且不可能在它们之间加入两个或更多表。
一种想法是在Hbase
上使用hadoop
来实现这一点,方法是存储我需要加入的所有列。因为我不需要临时查询,只需要每天将数据同步到HDFS。
但我不确定Hbase是否适合这种情况,因为我必须在很多条件下过滤行。
是否有人对此有任何建议?
答案 0 :(得分:1)
您可以使用sqoop将数据库从sqlserver和mysql导入HDFS,然后使用Hive查询导入的数据。 Hive支持SQL,您可以使用Hive执行JOIN。
我认为你不能用HBase做JOIN。