使用分类器预测新数据

时间:2018-11-09 09:25:42

标签: python machine-learning

嗨,我有一个程序,我正在尝试训练不同的模型,以选择最准确的模型。因此,我有:

def updateBestClassifier(predictions, classifier, name, count_vect):
   global bestAccuracy, bestClassifier, modelName, bestCountVect
   if(predictions > bestAccuracy):
      bestAccuracy = predictions
      bestClassifier = classifier
      modelName = name
      bestCountVect = count_vect

其中bestAccuracy最初为0,预测是模型的准确性得分。我使用实际模型,模型名称(字符串)更新bestClassifie r并使用bestCountVect更新count_vect

然后我尝试用以下几行来预测新文本:

text = unknownDf['Text']
transText =  bestCountVect.transform(text)
predict = bestClassifier.predict(transText )

但是我遇到以下错误:

ValueError: Incompatible dimension for X and Y matrices: X.shape[1] == 17400 while Y.shape[1] == 5000

知道为什么要这么做吗?

0 个答案:

没有答案