PIG拉丁语 - 特殊字符处理 - Å - 资本A,上面有戒指

时间:2015-07-10 06:23:20

标签: regex hadoop apache-pig

我想检查列是否包含一些特殊字符并进一步进行评估,我能够对大多数spl字符执行此操作,但不能对一个特定的spl字符执行此操作。有没有人遇到并处理这个spl char?Å?我甚至使用反斜杠来逃避它,但是徒劳无功,如下面的代码所示。

    --
    t1 = LOAD '$input_track1' using PigStorage('|') as (t1data:chararray,           sec_col:int);
    t1_output = foreach t1 generate $0, (CASE WHEN SUBSTRING($0, 0, 1) IN ('F','S') THEN 1 ELSE 0 END) AS ORR,
   (CASE WHEN SUBSTRING($0, 0, 1) IN ('^','@', '|','[',']','-','`','{','}','~','!','#','$','%','&','(',')','*','<','>',':','=','?', '"','\'''\Å')      THEN 1 ELSE 0 END) AS ORR2;
 dump track1_output;

示例数据:

ÅSecond| 456

0 个答案:

没有答案