标签: hadoop cascading
我正在开发一个级联程序,它不仅需要查找单词计数,还需要查找所有单词的总分数。我已经没有问题,直到单词计数本身,并计算所有计数的总和,进入一个单独的管道与一个字段和一个元组。
如果我可以得到每个单词计数元组的总数,我就没有问题进行计算。这是一个简单的笛卡尔产品......但我该怎么做?它似乎应该是一个没有连接字段的CoGroup,但这是不允许的。
答案 0 :(得分:0)
级联中的笛卡尔积可以使用buffers来实现。
给我输入数据的示例,以便我可以帮助您找到解决方案。
check this