问题是基于某些约束(例如,关键字长度必须等于或小于源关键字的长度),基于源关键字的变体(即关键字本身)生成关键字列表。
例如:
source_keyword = "message"
related_keywords["message"] = ["msg", "mesage", "mess", "mg", ...]
关于如何实现此目标的任何暗示,都不必要求像词网这样的单词词典并根据源关键字计算相似距离(例如Levenshtein)?
生成单词词典以及使用相似距离都很好。假定仅不使用(通常)常用单词列表来执行任务。