我有一个植物和植物性状的数据集。它是一个大型数据集,包含150多种植物和300多种不同性状。但是我没有这150种植物的全部300个性状的数据。一些植物具有100个性状的数据,另一些植物仅具有2个或3个性状的数据。
我已经找到了如何分离出具有最多性状数据的植物的方法,但是我却没有找到如何分离出这些植物具有相同性状的数据
例如。我有10个植物,编号为1-10,这10个植物中的每一个都有75个性状的数据,性状编号在1-3000之间。因此,每种植物都有75个不同的性状,但有一些重叠。我想找出哪些特征重叠。我想分析它们共享/共有的所有特征,所以我需要隔离共享特征。
在R中有简单的方法吗?似乎应该有一个相对简单的方法,但我不太清楚。
我的数据集看起来像这样,只是更大了。
在此示例中,我要突出显示特征1和特征4,因为这两个特征具有所有三个植物的数据。
我希望这一切都有道理。预先感谢大家的帮助!