我有制表符分隔的原始数据,我已将其存储为Hive表中的文本字符串。我希望能够获取第一个,第三个,......,x字段,并将结果存储到另一个具有我选择的字段名称的表中。例如,给出以下内容:
raw_table
:
Field1 Field2 Field3
01001 1 00-00-32-0-700-000.000
新custID_pin
Hive表:
custID PIN
01001 00-00-32-0-700-000.000
这是我到目前为止所拥有的:
DROP TABLE IF EXISTS custID_pin;
CREATE TABLE custID_pin AS
SELECT
[psuedocode: column1, column3, where columns are defined by the tab delimiter]
FROM raw_table;
如果使用制表符分隔文件而不是固定宽度文件,如何编写select语句以实现上述所需结果。
答案 0 :(得分:0)
这样的事情?
DROP TABLE IF EXISTS custID_pin;
CREATE TABLE custID_pin row format delimited fields terminated by '\t' STORED AS TEXTFILE AS select column1, column3 from raw_table where columns1="value";