标签: tensorflow nlp
我正在尝试在现有的Google BERT模型架构的基础上添加CNN层,以微调SQUAD2.0数据集。
代码主要是run_squad.py,我在其中插入了Depthwise CNN 1D post Embedding层。
体系结构如下:
问题是,当我使用BERT模型检查点时,它说尺寸不匹配,这很明显,因为该模型在BERT体系结构中隐藏了768尺寸。
如何在两者之间容纳CNN层?任何建议将不胜感激。