就分散变量而言,我的意思是变量x
具有多个值x1,x2,...xn
。虽然我能够代表x1,x2,xn...
,但我也想单独代表x
。
让我们说x
可以具有值[1,2,3,4],变量y
可以具有值[2,4,6,7]和另一个变量{{1} }的值可以为[1,4]。我们可以绘制z
,x
和y
的值。虽然我们可以做到这一点,但如何知道每个点来自哪个父级呢?有没有办法画这个?我以以下情况为例。
我正在尝试从数据框中进行绘制,其中一部分看起来像:
z
对于代表相同 pc1 pc2 quality kl gl
0 -1.619530 0.450950 5.0 4 1
1 -0.799170 1.856553 5.0 4 1
2 -0.748479 0.882039 5.0 4 1
3 2.357673 -0.269976 6.0 1 2
4 -1.619530 0.450950 5.0 4 1
5 -1.583707 0.569195 5.0 4 1
6 -1.101464 0.608015 5.0 4 1
7 -2.248708 -0.416835 7.0 3 5
8 -1.086887 -0.308569 7.0 4 1
9 0.654790 1.665207 5.0 2 3
10 -1.125204 0.860512 5.0 4 1
11 0.654790 1.665207 5.0 2 3
12 -3.026861 0.493540 5.0 3 5
13 1.538898 -0.235126 5.0 0 2
14 1.565268 4.795247 5.0 2 4
15 1.621249 4.780070 5.0 2 4
16 1.174566 1.142798 7.0 0 3
17 2.695205 1.215494 5.0 1 2
18 -0.722438 0.504672 4.0 4 1
19 3.335313 0.753669 6.0 1 2
20 0.623645 0.440113 6.0 0 3
21 -0.205985 0.967949 5.0 0 3
22 0.696407 -0.396999 5.0 0 3
23 0.053106 0.416543 5.0 0 3
24 -0.878555 0.381133 6.0 4 1
25 -1.164634 -0.610355 5.0 3 1
分数的子集。我用不同的颜色绘制了quality
的对应值。我以kl
为pc1
轴,以X
为pc2
轴。图中点的颜色由Y
决定。
对于代码段,我在下面给出了
kl
生成的图形符合预期。彩色点以plt.figure('km')
for quality_class in np.unique(quality_scores):
subset_to_plot = fdf[fdf['quality'] == quality_class]
plt.scatter(subset_to_plot['pc1'], subset_to_plot['pc2'], c = subset_to_plot['kl'], cmap='viridis')
plt.title(metrics.silhouette_score(reduced_data, km.labels_, metric='euclidean'))
表示列quality
。但是,有没有办法在同一张图中单独表示列kl
?从数据帧摘要中可以看到,列quality
具有多个值quality
。