如何获得与文本/文档相关的术语相关性分数

时间:2017-11-10 08:52:39

标签: nlp term relevance

我正在撰写文献资料。我能够使用NER和Ontologies识别重要实体。现在,我想将相关性分数分配给与文档相关的已识别实体。我需要一种方法来实现这一点,为了相关性,我还想考虑实体的间接出现例如 - 在第一次出现实体后的文档中(通过其名称)可以使用像它这样的术语来引用它,这个,那个..等等。我尝试了基于频率的方法,但没有得到正确的结果。

感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

对于实体的相关性分数,您可以测量它们之间的语义相似性。对于同一文档中的实体,我们可以期望它们应该共享一些语义。你可以试试wordnet:https://github.com/lasigeBioTM/DiShIn 要考虑实体的间接发生,您应该搜索回指解析工具。