我首先进行了训练/测试拆分,然后将该数据拟合到如下所示的LinearRegression模型中
from nltk import everygrams
text = 'I like playing baseball'
grams = ['_'.join(grams) for grams in list(everygrams(text, 1, 2))]
grams
>> ['I', 'like', 'playing', 'baseball', 'I_like', 'like_playing', 'playing_baseball']
已给我另一个测试数据框,并希望使其适合已创建的Log_m模型。所以我做到了
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.4, random_state = 101)
Log_m = LinearRegression()
Log_m.fit(X_train,y_train)
predictions = Log_m.predict(X_test)
但是我收到错误消息:
predictions_t = Log_m.predict(fin_df1_t)
这些是数据框的形状
ValueError: shapes (1450,262) and (282,) not aligned: 262 (dim 1) != 282 (dim 0)
答案 0 :(得分:1)
新测试数据(262)的特征列与Xtrain和Xtest(282)的特征列不相等,因此它将始终产生错误。两者应具有相同的功能列。 例如,Xtrain和Xtest具有相同的列(282),因此该步骤没有错误。