Question

嗨，我有一个程序，我正在尝试训练不同的模型，以选择最准确的模型。因此，我有：

def updateBestClassifier(predictions, classifier, name, count_vect):
   global bestAccuracy, bestClassifier, modelName, bestCountVect
   if(predictions > bestAccuracy):
      bestAccuracy = predictions
      bestClassifier = classifier
      modelName = name
      bestCountVect = count_vect

其中bestAccuracy最初为0，预测是模型的准确性得分。我使用实际模型，模型名称（字符串）更新bestClassifie r并使用bestCountVect更新count_vect。

然后我尝试用以下几行来预测新文本：

text = unknownDf['Text']
transText =  bestCountVect.transform(text)
predict = bestClassifier.predict(transText )

但是我遇到以下错误：

ValueError: Incompatible dimension for X and Y matrices: X.shape[1] == 17400 while Y.shape[1] == 5000

知道为什么要这么做吗？

使用分类器预测新数据

0 个答案: