合并/聚类术语和短语

时间:2009-12-22 07:56:59

标签: indexing full-text-search neural-network keyword consolidation

我们的应用程序允许用户输入其组织使用的公司名称。当前的问题是,用户输入公司名称的方式因用户而异。我们需要整合这些数据。有没有经过验证的方法来解决这个问题?

1 个答案:

答案 0 :(得分:1)

数据质量问题通常称为数据清理。这方面有很多方法和工具。

最适合您的问题取决于问题的严重程度以及您使用的技术。但是如果我理解得很好,那么存储的数据就可以了,问题是用户输入数据要搜索不正确的拼写?在这种情况下,模糊搜索可能有所帮助。