Question

就分散变量而言，我的意思是变量x具有多个值x1,x2,...xn。虽然我能够代表x1,x2,xn...，但我也想单独代表x。

让我们说x可以具有值[1,2,3,4]，变量y可以具有值[2,4,6,7]和另一个变量{{1} }的值可以为[1,4]。我们可以绘制z，x和y的值。虽然我们可以做到这一点，但如何知道每个点来自哪个父级呢？有没有办法画这个？我以以下情况为例。

我正在尝试从数据框中进行绘制，其中一部分看起来像：

对于代表相同pc1 pc2 quality kl gl 0 -1.619530 0.450950 5.0 4 1 1 -0.799170 1.856553 5.0 4 1 2 -0.748479 0.882039 5.0 4 1 3 2.357673 -0.269976 6.0 1 2 4 -1.619530 0.450950 5.0 4 1 5 -1.583707 0.569195 5.0 4 1 6 -1.101464 0.608015 5.0 4 1 7 -2.248708 -0.416835 7.0 3 5 8 -1.086887 -0.308569 7.0 4 1 9 0.654790 1.665207 5.0 2 3 10 -1.125204 0.860512 5.0 4 1 11 0.654790 1.665207 5.0 2 3 12 -3.026861 0.493540 5.0 3 5 13 1.538898 -0.235126 5.0 0 2 14 1.565268 4.795247 5.0 2 4 15 1.621249 4.780070 5.0 2 4 16 1.174566 1.142798 7.0 0 3 17 2.695205 1.215494 5.0 1 2 18 -0.722438 0.504672 4.0 4 1 19 3.335313 0.753669 6.0 1 2 20 0.623645 0.440113 6.0 0 3 21 -0.205985 0.967949 5.0 0 3 22 0.696407 -0.396999 5.0 0 3 23 0.053106 0.416543 5.0 0 3 24 -0.878555 0.381133 6.0 4 1 25 -1.164634 -0.610355 5.0 3 1分数的子集。我用不同的颜色绘制了quality的对应值。我以kl为pc1轴，以X为pc2轴。图中点的颜色由Y决定。

对于代码段，我在下面给出了

kl

生成的图形如下：

生成的图形符合预期。彩色点以plt.figure('km') for quality_class in np.unique(quality_scores): subset_to_plot = fdf[fdf['quality'] == quality_class] plt.scatter(subset_to_plot['pc1'], subset_to_plot['pc2'], c = subset_to_plot['kl'], cmap='viridis') plt.title(metrics.silhouette_score(reduced_data, km.labels_, metric='euclidean'))表示列quality。但是，有没有办法在同一张图中单独表示列kl？从数据帧摘要中可以看到，列quality具有多个值quality。

在散点图中表示分散的变量

0 个答案: