标签: python-3.x command-line-interface spacy
我想在命令行中使用spacy train命令进行训练。我使用基于规则的匹配器来获取我的训练数据,它位于元组列表中,例如(TEXT, {'entities':[(start, end, 'ORG')]})。 我对如何将其转换为可用于spacy CLI培训的JSON /一种格式感到有些困惑。我不能使用docs_to_json,因为它们不是doc对象。是否可以在此类数据上使用类似spacy convert的方法?还是有其他方法可以在CLI中使用此标记的数据?
spacy train
(TEXT, {'entities':[(start, end, 'ORG')]})
docs_to_json
spacy convert