我使用OpenNLP进行数据分类。我找不到疾病here的TokenNameFinderModel。我知道我可以创建自己的模型,但我想知道是否有任何大型样本培训数据可用于疾病?
答案 0 :(得分:1)
您可以使用modelbuilder addon轻松创建自己的训练数据集,并按照此处提到的一些规则训练创建好NER model。
你可以使用modelbuilder addon here找到一些帮助。
基本上,您将所有信息放在文本文件中,将NER实体放在另一个中。插件搜索特定实体并将其替换为所需的标签。因此产生标记数据。使用这个工具一定很容易!
希望这有帮助!