在我的项目中,我必须使用Collin解析器。但我有一个比解析器更新的数据集。现在,我遇到了Collins解析器无法识别的POS标签的问题。
例如,对于email addresses
和website addresses
,我有一个ADD
POS标记,但解析器无法识别它。我在柯林斯解析器中搜索了这个标签的对应部分,但我找不到任何东西。任何人都可以帮助我吗?
我甚至试图从在线Stanford Parser
获取eabove案例的POS,但我得到了不同的标签。例如,如果我写test@yahoo.com .
,与写test@yahoo.com
时相比,我为电子邮件地址设置了不同的POS标记。我的意思是点.
导致电子邮件地址具有不同的POS标记。
同时,我不想编写程序并为不同的案例确定正确的POS标签。这在我的工作中并不重要。我只需要为文件中的ReplaceAll
POS标记执行ADD
操作。
提前致谢,