我需要对庞大的数据集执行以下操作。那么,是否有更直接/更高效的方法来检查行值是否与其对应的组具有特定关系?以下是一个示例,我想按行检查column
的行值是否为给定组的最小值,并在new
中标记
# df is a data.table
# first get the minimum value per group
df[, Min:=min(column), by=list(idx1, idx2)]
df[, new:=month==Min]
df[, Min:=NULL]
答案 0 :(得分:1)
OP中没有可重复的示例,但我的猜测是可行的:
df[, new := (month == min(column)), by = list(idx1, idx2)]