标签: deep-learning sentiment-analysis text-classification bert-language-model transformer
如果我想在通用文本(与电影无关)中进行情感分析,使用 BERT(或任何其他基于 Transformers 的模型)对 IMDb 之类的数据集进行微调是否正确?
如果没有,我该怎么办?
答案 0 :(得分:0)
否,因为训练数据的域(IMDB 评论)与您要评估的域不同。这违反了机器学习的主要假设之一,即训练数据和测试/生产数据来自同一分布。
您可以做的称为“域适应”,因为您想在不同的域上执行相同的任务。但是为此,您需要标记数据,即对于每个文本,您需要有一个标签“正面”/“负面”/...