我正在寻找一种工具,可以比较两个文本字符串,并返回一个实际上是其相似性指标的结果(例如95%)。它需要在支持Java库的平台上实现。
我最好的猜测是我需要一些模糊逻辑比较工具来进行模糊匹配,然后返回相似度。
我在这里看到一些与模糊搜索相关的帖子,但我需要完全相反 - 这意味着我不想设置一些参数并返回类似的条目。相反,我手头有条目,但需要从他们那里得到那些相似性参数......
你能告诉我这件事吗?非常感谢答案 0 :(得分:1)
Apache的StringUtils有一个名为Levenshtein距离指示器的东西。 http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringUtils.html
Levenshstein距离是一种基于“编辑距离”输出相似度的算法。虽然我不确定这是否“模糊”。
实施例:
int distance = StringUtils.getLevenshteinDistance("cat", "hat");
答案 1 :(得分:0)
现在有一个图书馆可以做到这一点 https://github.com/intuit/fuzzy-matcher