我有psudeo分布式hadoop环境,并使用sqoop和hive进行数据导入和分析。
我使用sqoop将数据从mysql导入到hive并且工作正常,我在hive位置获取数据/user/hive/warehouse/
,我可以在hive表中查看数据。
我的怀疑是:
/user/hive/warehouse
?使用sqoop和hdfs概念执行数据摄取时,我感到很困惑
有人可以帮我吗?
答案 0 :(得分:1)
答案
1-数据仅存储在HDFS中。
2- hive-default.xml值下的属性“hive.metastore.warehouse.dir”告诉数据将被存储的位置默认值为“/ user / hive / warehouse”
3-用户查询在MapReduse作业more detail
上转换4-您可以使用SQOOP进行增量数据加载,所有数据都将存储在HDFS上,如果您创建了表格,则会反映出来。