使用Apache Pig
排名实用程序时,我遇到了这个奇怪的问题。我正在执行以下代码:
email_id_ranked = rank email_id;
store email_id_ranked into '/tmp/';
所以,基本上我试图得到以下结果
1,email1
2,email2
3,email3
...
问题有时猪会转储上述结果,但有时它只会转储没有排名的电子邮件。此外,当我使用dump
函数将数据转储到屏幕上时,猪会返回两列。我不知道问题出在哪里。请建议。
如果您需要更多信息,请与我们联系。提前谢谢。
猪版:Apache Pig版本0.11.0-cdh4.6.0