您是否可以在斯坦福命名实体识别器的CRFC分类器中使用最大数量的类/标签?

时间:2015-09-27 09:22:47

标签: stanford-nlp

您可以在斯坦福大学的NER CRFC分类器中使用最大数量的课程吗?

当你达到大约10万个不同的课程时会有什么后果吗?

1 个答案:

答案 0 :(得分:2)

我不太了解CRF,所以我可能错了,但是这篇论文:

http://people.eng.unimelb.edu.au/tcohn/papers/cohn06ecml.pdf

表示培训时间相对于课程数量呈二次方式增长。此外,如果您正在构建具有100,000个类的模型,那么您将需要远远超过用于生成4级NER模型的200,000个令牌。

我相信这会导致几个世纪或者几个月的训练时间!