我想知道为什么train_test_split和管道cross_val_score之间的r2_score有很大不同?我怀疑这是因为模型可以通过管道中的CountVectorizer()看到未知单词。但是基于管道的概念,CountVectorizer()应该只对由cross_val分割的训练集起作用吗?
wss://...
答案 0 :(得分:1)
r2_score(mypred, y_test)
是错误的。
您需要提供真实值作为第一输入,并提供预测值作为第二输入。将其更正为:
r2_score(y_test, mypred)
然后检查结果。