标签: deep-learning lstm crf
我正在使用BERT-BILSTM-CRF模型进行序列标记。我现在想要的是将重型模型提炼成更小的模型,如lstm-crf。在调查了相关论文之后,我发现几乎所有解决方案都基于softmax输出而不是crf输出。 crf输出蒸馏有解决方案吗?