我在DolphinDB中有一个DFS表。我试图运行一个查询,该查询将计算此表上的分组中位数。但这只是一个例外。
Environ
med(v1)列中的聚合函数没有map-reduce实现,因此无法应用于分区表或分布式表。
在我看来DolphinDB不支持分布式中值算法。
答案 0 :(得分:1)
聚合函数median
与avgerage
的不同之处在于它无法通过map-reduce解决。因此,我们必须提取数据,然后将中值函数应用于每个组。
DolphinDB的重新分区机制使这种工作更加容易。
ds = repartitionDS(<select first(col2) as col2, median(col1) as col1 from t>,`col2, VALUE)
mr(ds, x->x,,unionAll{false})