我正在尝试预测邮件是否为垃圾邮件。我已经标记了文本,并删除了停用词和标点符号,以形成一个称为“ bag_of_Words”的向量。 现在,我已获得执行线性回归和预测的任务。将向量作为输入参数拟合时,我会遇到错误,该如何处理。data frame with vector as a column。 以下是执行.fit()
的代码clf = LinearRegression(normalize=True)
clf.fit(df3_tr['vect'],df3_te['type'])
错误为-:ValueError:设置具有序列的数组元素。 请帮助我,因为我不知道如何继续进行操作。