我对线性链CRF实现的确切困惑。虽然有些人说“线性链CRF限制功能仅依赖于当前(i)和之前的标签(i-1),而不是整个句子中的任意标签”,有人说它限制了功能依赖在当前(i)和未来标签(i + 1)上。
我正在努力了解斯坦福NER模型背后的实现。有人可以解释一下线性链CRF模型究竟是什么?
答案 0 :(得分:3)
两种型号都是线性链CRF型号。关于“线性链”的重要部分是特征仅取决于当前标签和序列中的一个直接邻居。通常这将是之前的标签(因为它与阅读顺序相对应),但它也可能是未来的标签。这样的模型模型基本上会向后处理这个句子,我在文献中从未见过这个,但它仍然是一个线性链CRF)。
据我所知,斯坦福NER模型基于一个使用当前和之前标签的模型,但它也使用了一个扩展,它也可以向后看标签。因此,它不是严格的线性链模型,而是使用本文中描述的扩展:
Jenny Rose Finkel,Trond Grenager和Christopher Manning。 2005.通过Gibbs Sampling将非本地信息纳入信息提取系统。计算语言学协会第43届年会论文集(ACL 2005),第363-370页。 http://nlp.stanford.edu/~manning/papers/gibbscrf3.pdf