如何从dataframe获取前n个值

时间:2018-01-26 09:35:09

标签: scala apache-spark dataframe

我从csv文件读取数据帧,它非常像分数表,它有4列

school_name class_name, student_name, score

我想要做的是对学校和班级进行分组,并查看每个班级的前3个分数,我正在尝试这样做

val df = spark.read.format("csv")
  .option("sep", ",")
  .option("inferSchema", "true")
  .option("header", "true")
  .load("students.csv")

df.groupBy("school_name", "class_name")....

而且,我只是被困在这里。

有什么建议吗?

修改 这不是前3名,而是每个班级的前3名。

0 个答案:

没有答案