我在2D图表上显示的数据点如下所示。
1,1
1,2
2,1
2,2
3,3
8,8
9,8
8,9
9,9
编辑:
Now, if I have two initial given clusters, let's say (1,1) and (2,1), I want to use K means to decide the clusters based on Euclidean Distances with termination condition of 3 iterations.
我的方法是创建一个pandas数据帧,应用带有2个簇的kmeans并记下质心。
import pandas as pd
df = pd.DataFrame({'x': [1,1,2,2,3,8,9,8,9],
'y': [1,2,1,23,8,8,9,9]})
from sklearn.cluster import KMeans
kmeans = KMeans(2).fit(df.values)
但是,我被困住了。我如何定义自己的自定义功能。
我想将其迭代到下三次迭代,并记下计算以达到这三次迭代中的精确聚类。
由于