标签: nlp bert-language-model
我们知道bert的令牌最大长度限制为512,因此,如果Acticle的长度远大于512,例如文本中的10000令牌,那么长度就很大。在这种情况下,如何使用BERT?
答案 0 :(得分:0)
您有2个选择:
chunk_long_sequences
在您的情况下,大约有10000个令牌的序列,我会选择选项2。