我正在研究德语中的自然语言编程,我需要根据单词的含义对单词进行分类。 E.g'沟通','社交技巧','人际关系技巧'属于'沟通技巧'等等。
基本上,单词需要根据它与给定标准单词集的含义的相似性进行排序。
我尝试了Levenstein-distance
,edit-distance
和开源fuzzy
字符串匹配技术,但结果并不令人满意。
最佳结果来自于使用Longest-common Subsequence
单词列表,但我希望根据单词的基本含义匹配单词。
答案 0 :(得分:0)
您正在寻找的是“语义相似性”。一种可能的选择是使用Spacy或其他NLP框架。您可能希望探索单词2向量算法来帮助您完成任务。