我想要做的是添加一个自定义资源,告诉SyntaxNet将两个令牌组合成一个令牌。我处理来自NCBI的生物医学数据,物种几乎总是用它们的属(因此,属+种)编写。我需要将genus + species格式保存为单个标记。
EGS,
Arthrobacter globiformis (genus = "Arthrobacter", species = "globiformis")
Desulfosporosinus meridiei (genus = "Desulfosporosinus", species = "meridiei")
E. coli (genus = "E.", species = "coli")
有没有办法在SyntaxNet中执行此操作,不包括再培训?
答案 0 :(得分:0)
我担心你的问题没有简单(和原则)的解决方案。在使用SyntaxNet解析数据之前,您可以尝试预处理数据。更原则的解决方案需要更改代码。