当您从头开始构建自己的NER模型时,对于使用哪种类型的神经网络,我似乎无法从文档中找到明确的答案。
当我从头开始构建模型时,创建的cfg文件显示隐藏的depth = 1和以下设置。这是否意味着它具有1层的CNN?
“ cnn_maxout_pieces”:3, “ hidden_depth”:1, “ hidden_width”:128, “ maxout_pieces”:2
在本演练中,这似乎表明NER系统很深,但在我的cfg中,它似乎设置为1个隐藏层 https://spacy.io/universe/project/video-spacys-ner-model#___gatsb
“ spaCy v2.0的命名实体识别系统具有使用子词功能和“ Bloom”嵌入的复杂词嵌入策略,具有残差连接的深度卷积神经网络以及基于过渡的新颖方法来命名实体解析”
对于卷积层在仅使用NER的情况下的作用,我还不是100%清楚,我的训练数据仅包含没有依赖项解析或POS的实体
在这里提到了卷积层,但是它似乎只专注于依赖项解析https://spacy.io/models#architecture
“我们首先为输入中的每个单词预测上下文相关向量:” “该卷积层在标记器,解析器和NER之间共享,并且也将由未来的神经词条分解器共享”。