大家好,
我有我的桌面结构和下面的蜂巢。
Create table hv (x int,y int,z int ,w int )
PIGLATIN用于加载表
A = LOAD 'XYZ.CSV.GZ' using pigstorage AS (x,y,w)
这次Z col从文件中丢失所以我想在PIGLATIN中将z的值保持为null并且我不想更改我的hive表结构。如何在pig中为此列生成值为null?
答案 0 :(得分:0)
参考Nulls and constants你可以这样做:
--load your hive table
A = LOAD 'hive_db.table_name' USING org.apache.hive.hcatalog.pig.HCatLoader();
--this will generate a NULL column with datatype bytearray
B = FOREACH A GENERATE X,Y,NULL,W;
--then you can further process your data
STORE B INTO '/your/hdfs' USING PigStorage(',');