sqoop导入为镶木地板文件到目标目录,但无法找到该文件

时间:2017-02-08 08:13:52

标签: hadoop sqoop parquet

我一直在使用sqoop将数据从mysql导入到hive,我使用的命令如下:

sqoop import --connect jdbc:mysql://localhost:3306/datasync \
    --username root --password 654321 \
    --query 'SELECT id,name FROM test WHERE $CONDITIONS' --split-by id \
    --hive-import --hive-database default --hive-table a \
    --target-dir /tmp/yfr --as-parquetfile

创建Hive表并插入数据,但我找不到镶木地板文件。

有人知道吗?

致以最诚挚的问候,

费然

1 个答案:

答案 0 :(得分:1)

Sqoop导入到hive的工作分两步:

  • 从RDBMS获取数据到HDFS
  • 如果不存在则创建配置单元表并将数据加载到配置单表

在你的情况下,

首先,数据存储在--target-dir,即/tmp/yfr

然后,使用

将其加载到Hive表a

LOAD DATA INPTH ... INTO TABLE.. 命令。

comments 中所述,数据被移动到hive仓库目录,这就是--target-dir中没有数据的原因。