我使用text_classifier_learner编写了一个用于假新闻分类的模型。但是,当我使用800个虚假项目和800个真实新闻项目的一个子集(learn.fit_one_cycle(5))时,我最终会得到一个准确度值,或者在多个cyc_lens上重复一次。例如,相关代码的输出如下所示:
当我将cyc_len的值增加到10以上时,我看到了相同的现象,只是这次,不是重复一个单一的值,而是重复了2-3个不同的精度。
但是,当我将新闻报道的数量增加到21k +时,就不再重复而言,准确性是独立的。但是,即使在这种情况下,精度也会大幅度波动。它从60开始,然后一直随机下降到60,直到90。
我猜这里缺少一些超级基础知识,任何潜在客户都将真正帮助您!
我的一些代码可能很重要:
learn = text_classifier_learner(data, AWD_LSTM, drop_mult=0.5)
full_train=full_train.dropna()
data = (TextList.from_df(df=full_train, path=curr_dir, cols=2) .split_by_rand_pct(0.2) .label_from_df(cols=3) .databunch())
任何帮助将不胜感激!