同义词查找器文本挖掘算法

时间:2012-06-18 10:09:52

标签: data-mining text-mining synonym corpus

我想创建一个自动同义词查找器算法(主要用于品牌名称)。 例如,如果用户输入“可口可乐”一词,我想返回“可口可乐”这个词。

这可以使用dictoniaries轻松完成;但是我需要一个dictonary文件。 我该如何自动创建一个? (我有一个包含100万条记录的小型语料库,同义词将来自此。)

是否有针对此问题的文本挖掘算法? 此外,还有一些在线同义​​词服务,但这些服务不包含任何品牌名称: - (

谢谢, krisy

1 个答案:

答案 0 :(得分:0)

基于特里的算法可以找到同义词或类似的词。它不是使用键,而是在树中定位以定义键。例如,从A到B,从B到C,你有很多数据结构。最简单的是邻接列表或三元搜索树。