是否有人建议在原始文本中为NER类型标记工具?
工具的输入应该是一个文本文件库(.txt简单格式),应该有一个方便的UI用于选择单词并设置标签/注释适合选择,输出应该是标签的结构表示(e.gs tart index,最后一个索引,JSON格式的标记)
答案 0 :(得分:1)
LightTag的创始人
我们提供了一个超级方便的界面来进行跨度注释,例如命名实体识别,分类和关系。 您可以作为一个标签工作者或加入一个团队,LightTag会自动分散每个人之间的工作(不再选择文件并记住您已标记的内容)。
您可以上传自己的建议,让贴标签者使用它们,或者使用模型中内置的LightTag。 当然,您可以在字符级别进行注释并突出显示子词或多词短语。
答案 1 :(得分:0)
你可以尝试https://github.com/lasigeBioTM/MER(bash) 请参阅http://labs.fc.ul.pt/mer/
上的演示答案 2 :(得分:0)
在线工具:
我猜Dataturks' POS工具应该适用于您的用例,您只需上传数据并指定标签即可。用户界面似乎很方便。
这是链接: https://dataturks.com
它是一个在线工具,因此您可以与多人合作完成标记。
不支持您要查找的确切输出格式,但格式可以轻松转换为您要查找的内容,输出如下:word___LABEL word2___LABEL,因此一个简单的2行脚本可以将其转换为start和结束指数。
<强>离线:强>
您可以查看的另一个工具是神童,它是一个可下载的软件并做类似的事情。只是你可能愿意为此付出代价。 https://prodi.gy