标签: data-science wikipedia wordnet mining
我有一个关键字列表= [“关税”,“ GDP”,“失业”,“行业”,“农业”,“净资产”,“保险”,“医疗保健”,“贸易”,“风险投资']
,我需要计算文章中每个单词与这些关键字的相似度。 我遇到的问题是关键字包含诸如'venture capital'之类的空格,因为wordnet.synsets('venture capital')不起作用。
请帮助