我正在尝试获取Wordnet词典中所有名词和食品类别的单词。
我找到了一种方法来检查单词是否为名词。但是我需要相反的方法:
import nltk
nltk.download('wordnet')
from nltk.corpus import wordnet as wn
def if_food(word):
syns = wn.synsets(word, pos = wn.NOUN)
for syn in syns:
print(syn.lexname())
if 'food' in syn.lexname():
return 1
return 0
答案 0 :(得分:1)
所以我想我已经找到了解决方法:
# Using the NLTK WordNet dictionary check if the word is noun and a food.
import nltk
nltk.download('wordnet')
from nltk.corpus import wordnet as wn
def if_food(word):
syns = wn.synsets(str(word), pos = wn.NOUN)
for syn in syns:
if 'food' in syn.lexname():
return 1
return 0
然后使用qdapDictionaries::GradyAugmented
R英语单词词典,我检查了每个单词是否都是名词。
en_dict = pd.read_csv("GradyAugmentedENDict.csv")
en_dict['is_food'] = en_dict.word.apply(if_food)
en_dict[en_dict.is_food == 1].to_csv("en_dict_is_food.csv")
它确实完成了工作。
希望它会对他人有所帮助。