标签: scikit-learn nlp crf ner crfsuite
我有一些有关医学的研究论文。我想在文档中标记一些药品实体和一些相关实体。
我看到了有关NER,CRF的各种文章,这些文章使用了这样的训练数据集
获取语音数据的一部分并手动标记是一个冗长的过程。我有与此类似的数据集
是否可以使用上述第二种图像数据集来训练模型?
非常感谢任何可以说明这一过程的参考文章。
我检查了许多可用的CRF,NER标签文章以了解这一点,但没有帮助。所有使用POS标签的数据集
我无法添加图片,因为我没有足够的内容要做。