标签: hadoop apache-pig
我试图在另一列上的数据分组后使用Pig的内置 UDF SUM 来计算其中一列(data-type:float)的总和(数据类型) :chararray)。但是,我在同一次运行的多次迭代之间得到的结果略有不同。总和(多次运行之间)的差异范围从 0到2。 可能的原因是什么? SUM /浮点计算是非确定性的吗?另外,可以做些什么来避免相同的? (猪版 - 0.8.1 Hadoop版本 - 0.20.2 CHD3u5)