用于模糊比较文本字符串的Java库

时间:2015-07-29 14:08:01

标签: java fuzzy-logic fuzzy-comparison

我正在寻找一种工具,可以比较两个文本字符串,并返回一个实际上是其相似性指标的结果(例如95%)。它需要在支持Java库的平台上实现。

我最好的猜测是我需要一些模糊逻辑比较工具来进行模糊匹配,然后返回相似度。

我在这里看到一些与模糊搜索相关的帖子,但我需要完全相反 - 这意味着我不想设置一些参数并返回类似的条目。相反,我手头有条目,但需要从他们那里得到那些相似性参数......

你能告诉我这件事吗?非常感谢

2 个答案:

答案 0 :(得分:1)

Apache的StringUtils有一个名为Levenshtein距离指示器的东西。 http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringUtils.html

Levenshstein距离是一种基于“编辑距离”输出相似度的算法。虽然我不确定这是否“模糊”。

实施例: int distance = StringUtils.getLevenshteinDistance("cat", "hat");

答案 1 :(得分:0)

现在有一个图书馆可以做到这一点 https://github.com/intuit/fuzzy-matcher