多次调用`ner.update()`会有什么不同吗?

时间:2017-02-16 11:20:08

标签: named-entity-recognition spacy

我试图了解如何将实体类添加到命名实体识别器。 example code的结构如下所示:

ner = EntityRecognizer(nlp.vocab, entity_types=[... ENTITIES ...])
for itn in range(NUMBER_OF_ITERATIONS):
    for raw_text, entities in training_examples:
        ... some data handling ...
        ner.update(doc, gold)

,但接下来的示例(对于BILUO标签)仅调用ner.update()一次(即没有导致update()多次查看训练数据的for循环)。

我已阅读this question,其答案似乎告诉我,我多次为每个培训示例致电update();但后来我也认为他们可能只是遵循这些例子。

由于以下句子(从文档页面末尾开始)......

  

然后使用成本计算损失的梯度,以训练模型。

......我猜我的问题的答案是“是的,我应该通过在训练数据中反复'几次'来训练它”;但如果是这样的话,那么有人建议多少次“足够”吗? (示例代码使用5,但如果我认为它太少了,我最终可能会“太多次”迭代吗?I.e.,它是否“过度拟合”?)

0 个答案:

没有答案