标签: python apache-spark
l = [('Alice2', 1),('Alice3', 2),('Alice3', 3),('Alice1', 4),('Alice3', 5)] df = spark.createDataFrame(l,['name', 'age']) df.show() print df.approxQuantile("age", [0.5],0)
结果是[4.0],为什么不是[3.0]? 0.5是中位数