我目前正在开发一个NLP项目,该项目试图在上下文中区分同义词(从Python的NLTK与WordNet接收)。我已经研究了大量的NLP概念,试图找到我想要的东西,而我发现的最接近的东西是n-gram,但它不太合适。
假设我试图找到动词“box”的正确定义。 “盒子”可能意味着“打架”或“打包”;然而,在文本的其他地方,出现“ring”或“fighter”这个词。据我所知,n-gram将是“盒子战士”或“盒子戒指”,这是一个相当荒谬的短语,并且不太可能出现。但是在概念图上,“框”动作可能与“响铃”相关联,因为它们在概念上是相关的。
n-gram是我想要的吗?还有另一个名字吗?有关在何处查找检索此类关系数据的任何帮助?
感谢所有帮助。
答案 0 :(得分:2)
你可能想要研究word sense disambiguation (WSD)
,这是通过在特定的语境中使用这个词来确定单词的“意义”(含义)被激活的问题,这个过程似乎是在很大程度上是无意识的人。