我有一个长度为10的字符串,我希望从1到10位搜索每个字符的特定字符集。 SAS中的示例:if length(PAN_number)= 10和prxmatch(" / ^ [AZ] [AZ] [AZ] [CPHFATBLJG] [AZ] \ d \ d \ d \ d [AZ] /&#34 ;,PAN_number)
我希望在HAdoop / HIVE Sql中进行类似的搜索
答案 0 :(得分:0)
你可以在hive sql中做同样的事情。使用rlike而不是prxmatch,查询可能类似于下面(未经测试)。三次[A-Z] [A-Z] [A-Z]可以表示为[A-Z] {3},\ d \ d \ d \ d可以表示为\ d {4}
case when length(PAN_number)=10 and pan_number rlike '^[A-Z]{3}[CPHFATBLJG][A-Z]\d{4}[A-Z]'