UDF用于将数字格式化为Pig中的字符串

时间:2014-06-16 16:23:56

标签: apache-pig

在Pig中,我希望得到一个数字列,让我们说" 12345"并将其转换为格式为" $ 12,345"的字符串。

是否有现成的UDF来帮助标准格式化,例如添加美元符号,逗号,百分比等?我在文档中看不到任何内容

1 个答案:

答案 0 :(得分:1)

这是我可以利用的python UDF。

#!/usr/bin/python

@outputSchema("formatted:chararray")
def toDol(number):
    s = '%d' % number
    groups = []
    while s and s[-1].isdigit():
        groups.append(s[-3:])
        s = s[:-3]
        res = s + ','.join(reversed(groups))
        res = '$' + res
    return res

这就是你的猪脚本看起来像

的样子
Register 'locale_udf.py' using jython as myfuncs;
DT = LOAD 'sample_data.txt' Using PigStorage() as (dol:float);
DTR = FOREACH DT GENERATE dol,myfuncs.toDol(dol) as formattedstring;
dump DTR;

这应该适合你。