我正在尝试实施SMOTE
技术,因此我想使标签可视化。这种技术可以帮助我解决数据不平衡问题。
例如,我有1000个1, 2, and 3
标签,而计数分别为100, 100, 800
。在SMOTE
之后,我将添加综合值,以便为800, 800, and 800
标签添加1, 2, and 3
。
现在,我想在SMOTE
之前和之后绘制这些标签。我将数据集分为train_X
和train_y
。我尝试将虹膜代码调整为数据集,但失败了。这就是我尝试过的方法(不画任何东西并给出ValueError: 'c' argument has 154 elements, which is not acceptable for use with 'x' with size 25, 'y' with size 25.
错误):
from matplotlib import pyplot as plt
features = train_X
target = train_y.values.ravel()
plt.scatter(features[0], features[1], alpha=0.2,
s=100*features[3], c=target, cmap='viridis')
plt.xlabel("L1")
plt.ylabel("L2");
plt.show()
如何绘制带有不同颜色的标签,以便查看值的分布方式?