标签: nlp topic-modeling bert-language-model
我正在尝试将BERT单词嵌入到LDA主题模型中。语料库由多个句子(两个以上)组成。我注意到BERT模型从拥抱脸部需要分割ID,以区分句子。
BertModel可以支持两个以上的句子吗?
如果是这样,如何将段ID分配给不同句子中的标记?