Hadoop Pig Max Command

时间:2016-03-03 12:25:28

标签: hadoop apache-pig

我有一个文件,其中包含来自世界各地的所有国家/地区的数据。

我想找出拥有最多机场的国家。

我写了以下代码:

A = load 'airports.dat' USING PigStorage (',') AS(AirportID:int,Name:chararray,City:chararray,Country:chararray,IATA:chararray,IATAothers:chararray,Latitude:float,Longitude:float,Altitude:float,Timezone:float,DST:chararray,Zone:chararray);
B= GROUP A BY Country;
C= FOREACH B GENERATE A.Country, COUNT(A) AS Count;

但在此之后我无法获得如何找到最大值。

任何人都可以帮忙。

1 个答案:

答案 0 :(得分:1)

您已创建每个国家/地区的机场数量。您现在需要做的是获取具有最高编号的行:

dispatch_queue_t queue = dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_HIGH, 0);
    dispatch_async(queue, ^(void) {

        NSData *imageData = [NSData dataWithContentsOfURL:[NSURL URLWithString:parsedData[@"imageURL"]];

        UIImage* image = [[UIImage alloc] initWithData:imageData];
        if (image) {
             dispatch_async(dispatch_get_main_queue(), ^{

                     cell.imageView.image = image;
                     [cell setNeedsLayout];

             });
         }
    });