如何在Apache Pig中获取特定记录(元组)的内存大小?是否有任何功能可以帮助我们实现这一目标?
答案 0 :(得分:2)
是, 您可以尝试使用内置UDF SIZE 。
http://pig.apache.org/docs/r0.11.1/api/org/apache/pig/builtin/SIZE.html
因此,如果你想计算整个元组的大小,你可能需要首先将所有元组字段强制转换为bytearray,然后在每个元组上使用SIZE,并将它们全部精细地汇总在一起以获得元组大小以字节为单位 显然你可以将它转换为KB。