标签: sorting apache-spark apache-beam
请告诉我是否可以使用Apache光束进行并行排序?对于文档,Apache Beam可以使用单个机器进行排序。有没有办法实现并行排序?
答案 0 :(得分:1)
啊,所以你只是按键进行排序,而不是全局排序。请使用the SortValues transform。每个单独的密钥将使用一台计算机进行排序,但我认为您拥有每个密钥的数据量并不大。如果情况并非如此,请告诉我,如果尝试此变换后发现它的效果令人无法接受。