在Pig中,我希望得到一个数字列,让我们说" 12345"并将其转换为格式为" $ 12,345"的字符串。
是否有现成的UDF来帮助标准格式化,例如添加美元符号,逗号,百分比等?我在文档中看不到任何内容
答案 0 :(得分:1)
这是我可以利用的python UDF。
#!/usr/bin/python
@outputSchema("formatted:chararray")
def toDol(number):
s = '%d' % number
groups = []
while s and s[-1].isdigit():
groups.append(s[-3:])
s = s[:-3]
res = s + ','.join(reversed(groups))
res = '$' + res
return res
这就是你的猪脚本看起来像
的样子Register 'locale_udf.py' using jython as myfuncs;
DT = LOAD 'sample_data.txt' Using PigStorage() as (dol:float);
DTR = FOREACH DT GENERATE dol,myfuncs.toDol(dol) as formattedstring;
dump DTR;
这应该适合你。