嗨,我有一个程序,我正在尝试训练不同的模型,以选择最准确的模型。因此,我有:
def updateBestClassifier(predictions, classifier, name, count_vect):
global bestAccuracy, bestClassifier, modelName, bestCountVect
if(predictions > bestAccuracy):
bestAccuracy = predictions
bestClassifier = classifier
modelName = name
bestCountVect = count_vect
其中bestAccuracy
最初为0,预测是模型的准确性得分。我使用实际模型,模型名称(字符串)更新bestClassifie
r并使用bestCountVect
更新count_vect
。
然后我尝试用以下几行来预测新文本:
text = unknownDf['Text']
transText = bestCountVect.transform(text)
predict = bestClassifier.predict(transText )
但是我遇到以下错误:
ValueError: Incompatible dimension for X and Y matrices: X.shape[1] == 17400 while Y.shape[1] == 5000
知道为什么要这么做吗?