我正在寻找基于规则的方法或任何其他方法来识别文本中的所有提及。我找到了几个提供共识的库,但没有提到的确切选项。我想要的是如下所示:
输入文字:
[这位画家]放纵视觉幻想,在他1840年的建筑师梦中可以看到对不同历史建筑风格的欣赏。在“最后的莫希干人”的一系列画作之后,[他]在1829年进行了为期三年的欧洲之旅,但[他]更为人所知的是四年前的一次旅行,他在哈德逊河上游到了哈德逊河。卡茨基尔山脉。 FTP,名字[The Oxbow的这位画家]和The Voyage of Life系列。
*方括号突出显示。
我如何找到提及?另外,它与coreferences有何不同?如果有人可以发布相关论文的链接,那将会非常有用。
答案 0 :(得分:1)
我认为你可以从标准dcoref
注释器中得到你想要的东西。查看此注释器CorefChainAnnotation
设置的注释。这是从文档实体到" coref链的映射。"
每个CorefChain
都可以按文字顺序为您提供相关实体的提及列表。