我是轻量级熊猫用户,并且遇到了棘手的情况。我想合并“ case_id”周围的数据集的行。合并时,如果它们是唯一的,我希望“基因”(Gene)列按字母顺序将字符串连接在一起,且中间用“->”。也有一些列的值为0,另一些列的值为1,我希望合并时的1代替零。
df.groupby('case_id').agg(special_merge)
def special_merge(data):
//Handle 'Gene' Column ex. KRAS->SMAD4->TP53
//Handle 0 vs 1