Question

我已经训练了一个模型，试图将其应用于新数据。我对fast.ai完全陌生我正在按以下方式创建数据仓库（ds是我想要得分的数据）：

bs = 64
data_lm = (TextList.from_df(df, path, cols='comment_text')
            .split_by_rand_pct(0.1)
            .label_for_lm()
            .databunch(bs=bs))

问题在于我无法忽略.split_by_rand_pct（0.1），因此无法对整个数据进行评分

然后我按如下所示去加载/应用模型

data_clas = load_data(path, 'data_clas.pkl', bs=bs)
learn = text_classifier_learner(data_clas, AWD_LSTM, drop_mult=0.5)
learn.load_encoder('fine_tuned_enc')
learn.load('third');
preds, target = learn.get_preds(DatasetType.Test, ordered=True)
labels = preds.numpy()

但是问题是，当我创建数据绑定不正确时，我仅获得0.1％的数据作为第一段代码...我想将已保存/加载的模型应用于整个DF。

非常感谢

Answer 1

我的一位同事实际上为我提供了解决方案，我将其发布在这里，以防对任何人有用。

learn.data.add_test(df['Contact_Text'])
preds,y = learn.get_preds(ds_type=DatasetType.Test)
preds

如何应用在fast.ai / pytorch中开发的模型？

1 个答案: