我有一些问题
首先,我不知道如何在距离矩阵或对称矩阵中查找和删除异常值。
第二,我也使用带有平均链接的层次聚类。
我的数据是engmale161
(已经使用DTW建立了对称矩阵)
engmale161 <- na.omit(engmale161)
engmale161 <- scale(engmale161)
d <- dist(engmale161, method = "euclidean")
hc1_engmale161 <- hclust(d, method="average")
我发现用轮廓,wss和gap优化索引4。
>sub_grp <- cutree(hc1_engmale161,h=60, k = 4)
>table(sub_grp)
>table(sub_grp)
sub_grp
1 2 3 4
741 16 7 1
> subset(sub_grp,sub_grp==4)
4165634865
4
>fviz_cluster(list(data = engmale161, cluster = sub_grp), geom = "point")
因此,我认为右上点(4165634865)离群,并且只有一个点。 如何在H-C算法中删除异常值。
答案 0 :(得分:0)
只是一些想法。 简而言之,
长版:
祝你好运,我很高兴能成为真正查看数据的人!