我想知道是否有一种简单的方法可以检测两个字符串中的“短语”而不用引号。例如:
“我喜欢盒子里的插孔”和“盒子里的插孔有很好的食物”
在这种情况下,将检测到“框中的插孔”。现在我可能会通过整个第一个字符串,看看它是否在第二个字符串中,它不是......并且继续缩减到较小的长度并通过第二个字符串运行直到找到3个字符的匹配“杰克在盒子里”......但效率不高。
任何帮助都会很棒 - 谢谢!
答案 0 :(得分:2)
您指的是Longest Common Subsequence问题。这用作字符串比较的基础。
有很多关于这个问题的SO问题: https://stackoverflow.com/search?q=longest+common+subsequence
算法并不太难实现。维基百科有伪代码,您可以将其作为起点。