Apache Pig - 如何以KB为单位获取记录的大小?

时间:2015-01-05 10:07:26

标签: hadoop apache-pig

如何在Apache Pig中获取特定记录(元组)的内存大小?是否有任何功能可以帮助我们实现这一目标?

1 个答案:

答案 0 :(得分:2)

是, 您可以尝试使用内置UDF SIZE

http://pig.apache.org/docs/r0.11.1/api/org/apache/pig/builtin/SIZE.html

因此,如果你想计算整个元组的大小,你可能需要首先将所有元组字段强制转换为bytearray,然后在每个元组上使用SIZE,并将它们全部精细地汇总在一起以获得元组大小以字节为单位 显然你可以将它转换为KB。