Pig脚本:分析无模式数据

时间:2018-10-08 04:02:28

标签: apache-pig

我目前正在分析一系列文本文件,其中每个唯一数字都需要作为一个唯一元组读取(请参见下文)。

但是,如您所见,此数据没有任何已定义的模式,例如(number:int)。有没有一种方法可以将模式添加到已经装入的包或元组中?我将如何将这些元组加在一起?

grunt> dump B

(({(20),(5),(5),(10),(1),(1),(1),(1),(1),(5)}))

(({(1),(1),(1),(1),(1),(5),(10),(20),(10)}))

grunt> describe B;
B: {()}

谢谢!

0 个答案:

没有答案