math - 聚类分析-多参数

我要解决以下问题。我有数百个具有相应化学组成的粒子（具有其重量百分比的元素）。

作为一个例子，下面是一些人造的简化粒子：

第1部分-S（32％），K（25％），C（43％）

第2部分-S（33％），K（12％），C（15％），O（40％）

第3部分-钛（18％），硫（72％）

第4部分-钛（10％），硫（79％），钾（12％）

实际上有数百个，其中一些彼此完全不同，其中一些非常相似。如您所见，某些粒子没有某些元素（即可以用作0％）。

我想要实现的是执行聚类分析，该分析会将粒子分为具有相似粒子的组，并根据该聚类元素组成给我一些平均值。

我一直在研究聚类分析的工作原理，但是通常它仅使用2个参数，而我对每个粒子有许多元素，并且在对它进行聚类时，我不仅要考虑每个粒子的多个元素。我对包含的所有元素的精确匹配没有太大兴趣。换句话说，例如，如果大约2个粒子非常相似，只不过其中一个粒子含有很少量的一种额外元素，那也可以。测量时，有时背景噪声有时会导致非常低的百分比。

一旦我知道该使用哪种策略，我最好使用R来完成。但是，只要给我一个提示，就可以解决问题或建立链接。

聚类分析-多参数

0 个答案: