我想检查列是否包含一些特殊字符并进一步进行评估,我能够对大多数spl字符执行此操作,但不能对一个特定的spl字符执行此操作。有没有人遇到并处理这个spl char?Å?我甚至使用反斜杠来逃避它,但是徒劳无功,如下面的代码所示。
--
t1 = LOAD '$input_track1' using PigStorage('|') as (t1data:chararray, sec_col:int);
t1_output = foreach t1 generate $0, (CASE WHEN SUBSTRING($0, 0, 1) IN ('F','S') THEN 1 ELSE 0 END) AS ORR,
(CASE WHEN SUBSTRING($0, 0, 1) IN ('^','@', '|','[',']','-','`','{','}','~','!','#','$','%','&','(',')','*','<','>',':','=','?', '"','\'''\Å') THEN 1 ELSE 0 END) AS ORR2;
dump track1_output;
示例数据:
ÅSecond| 456