标签: python algorithm nlp word2vec sentence-similarity
我试图找到一种方法,通过算法计算句子中一个单词的信息量,这是基于句子与该单词缺失的约束程度。例如,如何计算“fox”一词在句子中提供的信息量:
“快速的棕色___跳过栅栏”
也就是说,在没有目标词的情况下,我如何计算用户填补空白的难度呢?
到目前为止,我尝试了一种方法,我将目标词的所有word2vec语义相似性与所有周围的单词进行比较,但这似乎并不总是有效。是否有任何已完成的工作?