我正在使用Lucene作为尽力匹配,从用户输入映射到以前输入的长列表进行分类 - 到目前为止,这种情况非常有用。
有问题的例子:
指数:
输入:
我想我正在寻找的是找到最长的常见子序列,以防它不是前两种情况之一 - 但话说回来,我对Lucene来说相对较新,所以也许我只是不知道足够的搜索-lingo正确解释。
答案 0 :(得分:1)
您可能需要的是 n-gramm相似性
请参阅NGramDistance课程
修改维基百科链接http://en.wikipedia.org/wiki/Approximate_string_matching