我创建了我的RDD对,我需要对它进行排序:
JavaPairRDD< String, String> pairsP= csvFileP.mapToPair(new keyData()).sortByKey(true).cache();
我的问题是:我想在pairRdds javapairRdd<int,string>
中使用一个int键
但它发生了一个错误,所以我尝试使用javapairRdd<Integer,string>
并且我没有错误但是当我使用函数sortByKey()
时,我发现它将键视为字符串而不是整数。
例如,我有这样的键:(1,...),(3,..),2(,...),(12,..),(22,..)
我在排序后寻找的结果是:(1,..),(2,..),(3,...),(12,..),(22,..)
但我发现这个:(1,..),(12,..),(2,..),(22,..),(3,...)
那么有没有可能让我的键成为一个int?
如果不能如何按我的意愿对我的rdd进行排序? 最后,是否可以通过验证密钥上的条件来停止扫描RDD?