在猪的水平上将nullls作为别名

时间:2017-01-25 07:45:15

标签: hadoop hive apache-pig bigdata

大家好,

我有我的桌面结构和下面的蜂巢。

Create table hv (x int,y int,z int ,w int )

PIGLATIN用于加载表

A  = LOAD 'XYZ.CSV.GZ' using pigstorage AS (x,y,w)

这次Z col从文件中丢失所以我想在PIGLATIN中将z的值保持为null并且我不想更改我的hive表结构。如何在pig中为此列生成值为null?

1 个答案:

答案 0 :(得分:0)

参考Nulls and constants你可以这样做:

--load your hive table
A = LOAD 'hive_db.table_name' USING org.apache.hive.hcatalog.pig.HCatLoader();

--this will generate a NULL column with datatype bytearray
B = FOREACH A GENERATE X,Y,NULL,W;

--then you can further process your data
STORE B INTO '/your/hdfs' USING PigStorage(',');