从hdfs加载数据问题在hive中

时间:2016-12-12 09:35:09

标签: hadoop hive hdfs

我正在尝试从hdfs加载hive中的表。我有下面提到的数据,请帮助我使用Delimeters。

104001;LOCAL CARD;LUXURY JEWELLERY CLASS (LJC) - TDFS;;;CANADA;CA;CAN;124
104002;LOCAL CARD;LUXURY JEWELLERY CLASS (LJC) - TDFS;;;CANADA;CA;CAN;124
104003;LOCAL CARD;LUXURY JEWELLERY CLASS (LJC) - TDFS;;;CANADA;CA;CAN;124
104004;LOCAL CARD;LUXURY JEWELLERY CLASS (LJC) - TDFS;;;CANADA;CA;CAN;124

1 个答案:

答案 0 :(得分:0)

通过查看您的数据集,";" 是字段分隔符。因此,hive中外部表的示例HQL查询可能如下所示:

CREATE EXTERNAL TABLE IF NOT EXISTS tablename
(
col1 INT,
col2 STRING,
col3 STRING,
col4 STRING,
col5 STRING,
col6 STRING,
col7 STRING,
col8 STRING,
col9 INT
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ';'
LOCATION '/user/username/input/';

假设:您的输入文件位于HDFS中 / user / username / input / 的位置。

请根据您的需要修改上述create声明。

希望这对你有所帮助!