我有一个带有1000个obs的data.frame。带有2个变量,带有以下描述性摘要;
var1 var2
Min. : 0.0 Min. : 0.0
1st Qu.: 837.8 1st Qu.: 651.5
Median :1465.0 Media : 819.5
Mean :1421.6 Mean : 832.6
3rd Qu.:1888.2 3rd Qu.: 990.0
Max. :3799.0 Max. :2271
和散点图https://www.dropbox.com/s/wnffqoavoyaw8ms/Rplot04.png?dl=0
我一直试图通过使用dbscan(fpc)来生成潜在的集群,但是即使我已经尝试了不同的eps值(0.5到5)和minPts(5到20),也根本无法生成任何集群。
如果有人建议使用eps和minPts的起点来生成至少2个基于此data.frame的集群,我将非常感激。
答案 0 :(得分:0)
给定值范围,eps = 5可能太低。
您是否尝试过在DBSCAN论文中提出的选择eps的启发式算法?
但从您的情节判断,只有一个基于密度的群集。 GMM可能会更好地适用于该数据集。也许OPTICS和mean-shift也会起作用。但是DBSCAN很难将这两个集群分开(你不能过分调整参数)