匹配部分文字

时间:2012-09-28 14:42:50

标签: c# sql-server

我需要了解逻辑,它将匹配比较两个字符串的重复字符集。

Car is blue and new vs Car is blue and old,会找到16场比赛 Car is , blue vs Car is blue color会找到Car is匹配和blue

所以基本上我需要找到两个字符串,SQL Server或C#,最好是SQL服务器,重复字符的百分比是多少。

我不希望有人给我写代码,但任何想法,链接或类似的东西都会受到欢迎。

3 个答案:

答案 0 :(得分:0)

这里没什么好主意,你可以得到一个字符串中所有单词的列表,然后检查它们是否存在于另一个字符串中:

string baseStringOne = "Car is blue and new", baseStringTwo = "Car is blue and old"; 
string[] subs = baseStringOne.Split(' '); 
foreach (string sub in subs)
{
  if (baseStringTwo.Contains(sub))
  {
     //Substring found!
  }
}

答案 1 :(得分:0)

我想你会发现这些相关:
The diff algorithm
An implementation for C#

答案 2 :(得分:0)

你可以通过以下方式获得不同的角色:

public static string Common(string s1, string s2)
    {
        return new string((s1.Intersect(s2)).ToArray());
    }