为什么partitionBy仅具有一个varargs参数,而sortBy除了varargs之外还具有另一个参数?

时间:2018-12-06 04:26:34

标签: scala apache-spark variadic-functions

参考Spark的Scala文档和文档的源代码(请参阅https://spark.apache.org/docs/latest/api/scala/index.html#org.apache.spark.sql.DataFrameWriter),我注意到sortBy和partitionBy函数的签名非常相似,可能应该相同,但是我不知道为什么sortBy将vararg分成两个参数。

在Github上,它确实说过,自从1.4版本的Spark以来,partitionBy就可用了,而从2.0版开始引入了sortBy。因此,也许有两位不同的作者做到了。只是不确定为什么会以另一种方式进行。我确实在某处读过,如果您有一个varargs参数,则可以完全忽略它,而传递一个Nil-那么也许谁写了sortBy想要通过强制至少一个列名可用来避免这样做?

0 个答案:

没有答案