我想使用Bert这样的语言模型来获取描述医疗状况的某些文本的特征向量。
由于大多数预训练的模型和标记生成器中的文本中有很多单词,我想知道要完成此任务需要哪些步骤?
使用预训练模型对我来说似乎是有益的,因为描述医疗状况的数据集非常小。
答案 0 :(得分:1)
是的,这个问题太笼统了,不能在Stack Overflow上使用,但是我会尝试给出一些有用的指示。
尝试查找任何现有的medical
预训练模型。
否则,请微调您域上的BERT / RoBERTa或您正在执行的任何下游任务(分类/问题解答),以捕获语料库中未知的医学术语。
答案 1 :(得分:0)