我从csv文件读取数据帧,它非常像分数表,它有4列
school_name class_name, student_name, score
我想要做的是对学校和班级进行分组,并查看每个班级的前3个分数,我正在尝试这样做
val df = spark.read.format("csv")
.option("sep", ",")
.option("inferSchema", "true")
.option("header", "true")
.load("students.csv")
df.groupBy("school_name", "class_name")....
而且,我只是被困在这里。
有什么建议吗?
修改 这不是前3名,而是每个班级的前3名。