分散功能在这里如何工作?我想知道以下代码中c=Y
的含义以及X[:,0]
和X[:,1]
的含义。
#make_blob is data set
X, Y = make_blobs(n_samples=500, centers=2, random_state=0, cluster_std=0.40)
plt.scatter(X[:, 0], X[:, 1], c=Y, s=50, cmap='spring')
plt.show()
答案 0 :(得分:1)
假设make_blobs
指向sklearn.datasets.make_blobs
:
X
代表要素数据集,而Y
代表相应的标签(目标)。因此,X
中的每一列代表一个功能。
X[:, 0]
以X
的形式对[row, column]
进行索引,其中:
表示“一切”。因此,组合表达式的意思是“从索引索引为0的列中的X中获取每一行”(即第一列)。
类似地,X[:, 1]
从第二列的X中获取每一行。
这些都可以作为散点图的x坐标和y坐标。
传递c=Y
告诉函数您希望基于Y
的相应值对点进行着色。因此,所有带有Y=0
的点将具有一种颜色,所有带有Y=1
的点将具有另一种颜色。