按键命令我的对RDD

时间:2016-06-15 11:31:45

标签: java apache-spark rdd

我创建了我的RDD对,我需要对它进行排序:

JavaPairRDD< String, String> pairsP= csvFileP.mapToPair(new keyData()).sortByKey(true).cache();

我的问题是:我想在pairRdds javapairRdd<int,string>中使用一个int键  但它发生了一个错误,所以我尝试使用javapairRdd<Integer,string>并且我没有错误但是当我使用函数sortByKey()时,我发现它将键视为字符串而不是整数。  例如,我有这样的键:(1,...),(3,..),2(,...),(12,..),(22,..)  我在排序后寻找的结果是:(1,..),(2,..),(3,...),(12,..),(22,..)  但我发现这个:(1,..),(12,..),(2,..),(22,..),(3,...)  那么有没有可能让我的键成为一个int?

如果不能如何按我的意愿对我的rdd进行排序? 最后,是否可以通过验证密钥上的条件来停止扫描RDD?

0 个答案:

没有答案