我正在学习Stanford CS224N:通过深度学习进行自然语言处理。
克里斯说
“人类传感器之间的细微差别 几乎无法理解它们之间的区别并与之相关。
在Lecture 1中,他正在演示一段NLTK代码。
nltk中是否有一个名为sensor的符号?如果是,那是什么意思?
答案 0 :(得分:0)
我认为YouTube的自动字幕错误,并且讲师发音了synset一词。
是的,NLTK中有一个同义词集符号,实际上该符号来自Wordnet。
您可以通过以下方式获得同义词集:
from nltk.corpus import wordnet as wn
dog = wn.synset('dog.n.01')
其中 dog 是其中一个引理的形态词干, n 是言语的一部分(在本例中为名词),而 01 是索引。
同义词(wordnet_corpus_reader)
从 lemma.pos.number 字符串创建同义词集,其中: lemma 是单词的词干 pos 是模块属性之一ADJ,ADJ_SAT,ADV,NOUN或VERB number 是有义数字,从0开始计数。