标签: python pyspark
我正在用3列(文档,部门,dispatch_date)的数据帧编写一个火花查询,其中同一文档可以多次发送到多个部门。我正在尝试获取每个文档以及获得文档的部门的最新信息。
我试图按发送日期对数据框进行排序,并获取部门和日期的第一个数据,但无济于事-spark按字母顺序返回第一个部门,而无论最后接收者是否为接收者。