我正在使用两个字符串来匹配这样的程序:
string s1= 5-4-6-+1-+1+1+3000+12+21-+1-+1-+1-+2-3-4-5-+1-+10+1-+1-+;
string s2= 6-+1-+1+1+3000+12+21-+1-+1-+1-+1-+1-+1+1-+1-+;
我将编写一个Regex匹配函数,它分别比较每个“+”之间的每个部分字符串,并计算匹配百分比,即每个字符串中发生的匹配数。 例如,在此示例中,我们有以下匹配项:
6
1
1
1
3000
12
21
1
1
1
--
1
--
1
1
在此示例中,匹配百分比为13 * 100/15 = 87%。
目前我正在使用下面的功能,但我认为它没有经过优化,使用Regex可能会更快。
public double MatchPercent(string s1, string s2) {
int percent=0;
User = s1.Split('+').ToArray();
Policy = s2.Split('+').ToArray();
for (int i = 0; i < s1.Length - 2; i++) {
int[] U = User[i].Split('-').Where(a => a != "").Select(n =>
Convert.ToInt32(n)).Distinct().ToArray();
int[] P = Policy[i].Split('-').Where(a => a != "").Select(n =>
Convert.ToInt32(n)).Distinct().ToArray();
var Co = U.Intersect(P);
if (Co.Count() > 0) {
percent += 1;
}
}
return Math.Round((percent) * 100 / s1.Length );
}
答案 0 :(得分:2)
更好的解决方案是Levenshtein Word Distance算法。一些C#样本:
从匹配的字符中,您还可以计算百分比。