我正在练习机器学习,我想在聚类图上添加注释。
在这里,我正在使用土壤样本数据,并试图将它们分为几组。当我专注于特定元素时,我想查看其他元素的相关性或找出样本ID并在地图上查看它们。我现在正在尝试将ID放在地块上,但不确定如何使用lmplots。
import pandas as pd
import seaborn as sns
sns.set()
data=pd.read_csv("E:\Programming\Python\Matplotlib\Geochemi_test3.csv", index_col=0) #reading my dataset
data_x = data.drop(labels=["E","N","B_ppm","Geology","Height"], axis=1)
data_y=data["Geology"]
from sklearn.decomposition import PCA
model = PCA(n_components=2)
model.fit(data_x)
X_2D = model.transform(data_x)
data['PCA1'] = X_2D[:, 0]
data['PCA2'] = X_2D[:, 1]
#sns.lmplot("PCA1", "PCA2", data=data, hue="Geology", fit_reg=False)
from sklearn.mixture import GaussianMixture as GMM
model = GMM(n_components=4,covariance_type='full')
model.fit(data_x)
y_gmm = model.predict(data_x)
data['cluster'] = y_gmm
fgrid = sns.lmplot("PCA1", "PCA2", data=data, hue="Se_ppm", col="cluster",fit_reg=False)
ax = fgrid.axes[0,0]
p1=sns.regplot(data=data, x="PCA1", y="PCA2", fit_reg=False, marker="o", scatter_kws={'s':10})
for line in range(0,data.shape[0]):
p1.text(data.PCA1[line]+0.2, data.PCA2[line], data.index[line], horizontalalignment='left', size='medium', color='black', weight='semibold')
这段代码的结果我得到了这个图。 是否可以在每个轴上添加注释?在此,注释仅显示在右轴上。 当我搜索注释时,只能在regplot上找到图。我也可以在按列划分的lmplot上添加注释吗?
答案 0 :(得分:1)
返回lmplot
是FacetGrid
。您需要在FacetGrid中指定每个Axes对象以对每个对象进行注释。像这样:
for ax in fgrid.axes:
for line in range(0,data.shape[0]):
ax.text(...)
但是,您似乎通过regplot
调用覆盖了最后一个Axes对象。我不确定这是否是故意的。