应用错误收集

我从csv文件读取数据帧，它非常像分数表，它有4列

school_name class_name, student_name, score

我想要做的是对学校和班级进行分组，并查看每个班级的前3个分数，我正在尝试这样做

val df = spark.read.format("csv")
  .option("sep", ",")
  .option("inferSchema", "true")
  .option("header", "true")
  .load("students.csv")

df.groupBy("school_name", "class_name")....

而且，我只是被困在这里。

有什么建议吗？

修改这不是前3名，而是每个班级的前3名。

如何从dataframe获取前n个值

0 个答案: