在将训练数据集提供给聚类模型之前,我正在使用StandardScaler转换数据。
X = StandardScaler().fit_transform(X_train)
假设,clf是无监督的聚类模型,我预测标签如下:
y = clf.predict(X)
问题:如何组合“y”和“X_train”numpy数组?我不确定StandardScaler()是否维护矩阵内的顺序。那么,这会有用吗?
df = pd.DataFrame(np.array(X_train), np.array(y))
答案 0 :(得分:1)
是的,所有scikit-learn变压器都保留样品和样品。排序。否则他们就没用了。