我正在使用Dstream的Transform API(Spark Streaming)来对数据进行排序。 我正在使用netcat从TCP套接字读取。 遵循使用的代码行: myDStream.transform(RDD => rdd.sortByKey())
无法找到函数sortByKey。任何人都可以帮助解决这一步骤中的问题吗?
答案 0 :(得分:1)
如果您使用netcat
作为输入,则可能会使用返回socketTextStream
的{{1}}。在这种情况下,ReceiverInputDStream[String]
将采用一种功能:
transform
(RDD[String]) => RDD[U]
只有RDD[(T, U)]
对应T
的{{1}}可以是Orderign
。对于其他sortedByKey
,您可以使用RDD
:
sortBy