我已经基于两个不同的drop
值并具有相同的迭代次数来训练NER模型,如下所示:
scenario1:- nlp.update([text],[annotations],drop=0.2,sgd=optimizer,losses=losses)
scenario2:- nlp.update([text],[annotations],drop=0.5,sgd=optimizer,losses=losses)
注意:-对于场景number of iterations are 100
和training data size
均为75。
如何根据损失评估哪种情况更好?任何人都可以提出在进行评估时需要考虑的哪些事情。
我正在打印类似losses iteration number 99 {'ner': 1.7483434898698305e-14}
这样的损失