我已经对我的数据进行了聚类并绘制了它,但是为什么它会像这样绘制,为什么它会显示所有这样的聚类,而如果它使x和y的范围变小,它们将没有任何重叠并且将被绘制分别。我应该使用任何缩放或任何东西吗?
这里是代码:
db = DBSCAN(eps=epsilon, min_samples=200, algorithm='ball_tree', metric='haversine').fit(X)
labels = db.labels_
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
unique_labels = set(labels)
colors = plt.cm.Spectral(np.linspace(0, 1, len(unique_labels)))
for color, k in zip(colors, unique_labels):
if k != -1:
class_member_mask = (labels == k)
xy = X[class_member_mask]
area=np.pi * (10 * np.random.rand(len(xy[:, 0])))**2
plt.scatter(xy[:, 0], xy[:, 1], s=area, c=color, alpha=0.5)
plt.title('Estimated number of clusters: %d' % n_clusters_)
如果我使用X = StandardScaler()。fit_transform(X),情节将如下所示。但我不希望它与var = 1一起缩放。