您可以在斯坦福大学的NER CRFC分类器中使用最大数量的课程吗?
当你达到大约10万个不同的课程时会有什么后果吗?
答案 0 :(得分:2)
我不太了解CRF,所以我可能错了,但是这篇论文:
http://people.eng.unimelb.edu.au/tcohn/papers/cohn06ecml.pdf
表示培训时间相对于课程数量呈二次方式增长。此外,如果您正在构建具有100,000个类的模型,那么您将需要远远超过用于生成4级NER模型的200,000个令牌。
我相信这会导致几个世纪或者几个月的训练时间!