如何在WordNet中提取名词食物类别中的所有单词?

时间:2019-07-16 12:15:01

标签: python nltk python-3.7 wordnet

我正在尝试获取Wordnet词典中所有名词和食品类别的单词。

我找到了一种方法来检查单词是否为名词。但是我需要相反的方法:

import nltk
nltk.download('wordnet')
from nltk.corpus import wordnet as wn

def if_food(word):
    syns = wn.synsets(word, pos = wn.NOUN)
    for syn in syns:
        print(syn.lexname())
        if 'food' in syn.lexname():
            return 1
    return 0

1 个答案:

答案 0 :(得分:1)

所以我想我已经找到了解决方法:

# Using the NLTK WordNet dictionary check if the word is noun and a food.
import nltk
nltk.download('wordnet')
from nltk.corpus import wordnet as wn

def if_food(word):

    syns = wn.synsets(str(word), pos = wn.NOUN)

    for syn in syns:
        if 'food' in syn.lexname():
            return 1
    return 0

然后使用qdapDictionaries::GradyAugmented R英语单词词典,我检查了每个单词是否都是名词。

en_dict = pd.read_csv("GradyAugmentedENDict.csv")

en_dict['is_food'] = en_dict.word.apply(if_food)

en_dict[en_dict.is_food == 1].to_csv("en_dict_is_food.csv")

它确实完成了工作。

希望它会对他人有所帮助。