我在R中有一个数据框,如下所示:
bin Family Genus
1 blue flower
1 green moss
1 blue tree
2 red bird
2 red lizard
可能多次使用相同的bin,并且关联的族/属可能不是一个bin所特有的。我希望识别与每个箱子相关联的所有家庭,以及每个家庭与每个箱子相关联的次数。我将重复对属的测试。
我最终试图确定与每个bin相关联的名称是否存在变化,因此我可以为每个bin选择最常用的名称,并为该bin分配一个名称。我的数据框非常庞大,有数千个垃圾箱。