我想使用嵌入的BERT词作为矢量来构建Torchtext中的vocab 我可以加载矢量,例如GloVe或word2vec 但我不知道如何将BERT中嵌入的单词保存为Torchtext vocab可接受的格式
当我尝试此代码时
txt_field.build_vocab(火车,vectors = bertVec)
我收到此错误
ValueError:得到了类型为,预期str或Vectors对象的输入向量
答案 0 :(得分:0)
没有直接的方法可以为BERT嵌入创建Vocab。
原因如下:
因此,使用BERT构建单词的词汇表可能是不可能的,因为相同的单词可能采用不同的嵌入方式。