我要解决以下问题。 我有数百个具有相应化学组成的粒子(具有其重量百分比的元素)。
作为一个例子,下面是一些人造的简化粒子:
第1部分-S(32%),K(25%),C(43%)
第2部分-S(33%),K(12%),C(15%),O(40%)
第3部分-钛(18%),硫(72%)
第4部分-钛(10%),硫(79%),钾(12%)
实际上有数百个,其中一些彼此完全不同,其中一些非常相似。如您所见,某些粒子没有某些元素(即可以用作0%)。
我想要实现的是执行聚类分析,该分析会将粒子分为具有相似粒子的组,并根据该聚类元素组成给我一些平均值。
我一直在研究聚类分析的工作原理,但是通常它仅使用2个参数,而我对每个粒子有许多元素,并且在对它进行聚类时,我不仅要考虑每个粒子的多个元素。我对包含的所有元素的精确匹配没有太大兴趣。换句话说,例如,如果大约2个粒子非常相似,只不过其中一个粒子含有很少量的一种额外元素,那也可以。测量时,有时背景噪声有时会导致非常低的百分比。
一旦我知道该使用哪种策略,我最好使用R来完成。但是,只要给我一个提示,就可以解决问题或建立链接。