如果你能解释我做错了什么,我们将非常感激。
脚本适用于大多数部分,但是当我使用group by并转储结果时,我收到错误说other_vertex_failure;
示例数据
1,苹果,5.5
2,橙色,2.5
2,橙色,4.5
3,猕猴桃,1.5
3,猕猴桃,3.5
4,香蕉,4.0
4,Banana,6.0
A = LOAD '/user/pig/apple.csv' USING PigStorage(','); **--this works**
B = FOREACH A GENERATE $0 as ids:int, $1 as fruit:chararray,
$2 as quan:int; **--this works**
C = GROUP B BY ids; **--this works gives no error**
但是当我转储C时;它会引发错误。
是否使用具有位置参数的名称在猪中是个坏主意?
答案 0 :(得分:0)
您可以Headers have not been sent.
Headers sent!
将alias
分配给您自己的字段。
由于您尚未完成,因此字段默认为LOAD
。当它试图将bytearray
投射到bytearray
时,它会抛出int
。
ClassCastException