NER之后,您可以训练自定义语义解析器吗?

时间:2019-12-02 23:57:54

标签: spacy

我有一个相当大的项目,负责识别“属性描述”中的实体并将它们关联在一起。我能够创建大量的训练数据,并成功地训练了NER模型来识别实体。但是,我在训练解析器时遇到问题。我已经使用合并后的实体训练了一组数据(通过NER识别的许多实体是多个单词)。训练时,我得到与列表索引超出范围有关的错误。

我的问题确实集中在培训发生时的操作顺序上。如果禁用NER和Merge Entities管道,训练时令牌是否不受影响?

文档建议使用Entity Recognizer和re-tokenizer来确保准确性,但实际上并未提供示例。

作为参考,我的解析器训练数据看起来像这样:

TRAIN_DATA = [
(
   "Brendt McKnight is a Person",
  { 
     "heads": [3,1,1,0],
     "deps": ["NAME","-","-","ROOT"],
   },
),
]

您会看到我的训练数据将“ Brendt McKnight”视为一个实体。

感谢您的帮助

0 个答案:

没有答案