我想创建一个自动同义词查找器算法(主要用于品牌名称)。 例如,如果用户输入“可口可乐”一词,我想返回“可口可乐”这个词。
这可以使用dictoniaries轻松完成;但是我需要一个dictonary文件。 我该如何自动创建一个? (我有一个包含100万条记录的小型语料库,同义词将来自此。)
是否有针对此问题的文本挖掘算法? 此外,还有一些在线同义词服务,但这些服务不包含任何品牌名称: - (
谢谢, krisy
答案 0 :(得分:0)
基于特里的算法可以找到同义词或类似的词。它不是使用键,而是在树中定位以定义键。例如,从A到B,从B到C,你有很多数据结构。最简单的是邻接列表或三元搜索树。