我已经训练了一个模型,试图将其应用于新数据。我对fast.ai完全陌生 我正在按以下方式创建数据仓库(ds是我想要得分的数据):
bs = 64
data_lm = (TextList.from_df(df, path, cols='comment_text')
.split_by_rand_pct(0.1)
.label_for_lm()
.databunch(bs=bs))
问题在于我无法忽略.split_by_rand_pct(0.1),因此无法对整个数据进行评分
然后我按如下所示去加载/应用模型
data_clas = load_data(path, 'data_clas.pkl', bs=bs)
learn = text_classifier_learner(data_clas, AWD_LSTM, drop_mult=0.5)
learn.load_encoder('fine_tuned_enc')
learn.load('third');
preds, target = learn.get_preds(DatasetType.Test, ordered=True)
labels = preds.numpy()
但是问题是,当我创建数据绑定不正确时,我仅获得0.1%的数据作为第一段代码...我想将已保存/加载的模型应用于整个DF。
非常感谢
答案 0 :(得分:0)
我的一位同事实际上为我提供了解决方案,我将其发布在这里,以防对任何人有用。
learn.data.add_test(df['Contact_Text'])
preds,y = learn.get_preds(ds_type=DatasetType.Test)
preds