使用Pig脚本

时间:2016-12-08 06:51:57

标签: apache-pig

我有一个包含以下数据的csv文件

characteristic, total/Percent 
Kids below 18, 24
mental problem, 30.7
physical problem 69.3
kids above 18, 40
mental problem, 41.20
physical problem, 59.80

现在使用猪脚本我需要找出18岁以上孩子的心理问题百分比。

有人可以帮助我吗?

此致

阿迪蒂亚

1 个答案:

答案 0 :(得分:1)

实际上有两种方式 - 简单和困难

1。更改csv文件的结构 - 目前您的数据中包含数据特征

   characteristic, Percent, Age group 
   mental problem, 30.7, under18 
   physical problem 69.3, under18 
   mental problem, 41.20, above18 
   physical problem, 59.80, above18

在这种情况下,您只需过滤所需的行

即可
  1. 编写一个自定义加载程序,它将对数据进行一些预处理。这是一个艰难的方式,但如果你不能改变输入结构,它可以是你的选择