如果我有训练集trainX
,trainy
,我知道您可以使用
pca = PCA(n_components=5)
Xred = pca.fit(trainX).transform(trainX)
如果我想运行一个模型,比如说线性回归,那么我可以在testX
上运行PCA吗?
像这样:
clf = linear_model.LinearRegression()
clf.fit(trainX, trainY)
testXred = pca.fit(testX).transform(testX)
predictions = clf.predict(testXred)
或者我只在训练集上运行PCA,所以线性回归预测应该是这样吗?
predictions = clf.predict(testX)
还是这个?
testXred = pca.fit(trainX).transform(testX)
predictions = clf.predict(testXred)