检测2个字符串中第一个差异的位置

时间:2015-09-30 05:44:13

标签: javascript string-matching

在Javascript中查找任意两个字符串中第一个差异的位置的最简洁方法是什么?

var a = 'in the';
var b = 'in he';
findFirstDiffPos(a, b); // 3

var c = 'in the beginning';
findFirstDiffPos(a, c); // 6 

4 个答案:

答案 0 :(得分:7)

循环

循环方法可以更简洁地编写为

function findFirstDiffPos(a, b) {
  var i = 0;
  if (a === b) return -1;
  while (a[i] === b[i]) i++;
  return i;
}

根据jsperf,这个替代方案比其他方案快5-20倍,并不令人惊讶。

Array#findIndex

由于我们试图找到某个条件所在的索引,这似乎是findIndex的完美应用:

function findFirstDiffPos(a, b) {
  if (a.length < b.length) [a, b] = [b, a];
  return [...a].findIndex((chr, i) => chr !== b[i]);
}

(我们需要更长的数组作为我们查找的数组,因此我们在必要时颠倒顺序。我们使用[...a]将字符串转换为字符数组。)

免责声明:这是一个ES6界面,您必须在IE上填充(但不是Edge)。

这种替代方案比直线循环慢20倍。

递归

只是为了好玩,这是一个递归解决方案:

function findFirstDiffPos(a, b) {
  return function _iterate([headA, ...tailA], [headB, ...tailB], n) {
    return headA !== headB ? n : headA === undefined) ? -1 : _iterate(tailA, tailB, n+1);
  }(a.split(''), b.split(''), 0);
}

正则表达式

同样在“只是为了好玩”类别中,一个正则表达式解决方案。我们将从一个字符串构造一个/^(a(b(c)?)?)?/形式的正则表达式,并将其与另一个字符串匹配,并检查匹配的长度。

function make_regexp(str) {
  var result = '';
  for (var i = str.length-1; i >= 0; i--)
    result = '(' + str[i] + result + ')?';
  return '^' + result;
}

function findFirstDiffPos(a, b) {
  return a === b ? -1 : b.match(make_regexp(a))[0].length;
}

即使我们预编译正则表达式,这仍然比普通的旧循环慢五倍。

答案 1 :(得分:3)

您可以简单地遍历字符串并逐个字符地进行检查。

&#13;
&#13;
document.body.innerHTML += findFirstDiffPos("in he", "in the") + "<br/>";
document.body.innerHTML += findFirstDiffPos("abcd", "abcde") + "<br/>";
document.body.innerHTML += findFirstDiffPos("zxc", "zxc");

function findFirstDiffPos(a, b)
{
   var shorterLength = Math.min(a.length, b.length);

   for (var i = 0; i < shorterLength; i++)
   {
       if (a[i] !== b[i]) return i;
   }

   if (a.length !== b.length) return shorterLength;

   return -1;
}
&#13;
&#13;
&#13;

输出 3 4 -1
3 :因为字符串在位置3处不同 4 :字符串abcdabcde的前缀,但它们的长度不同。字符串abcd中不存在第4个(从0开始)字符。您可以根据您的要求更改此逻辑 -1 :字符串相等

更新:正如@torazaburo在评论中提到的那样,代码可以更容易 - 只需循环一直到它们长度的Math.max()。它会起作用,因为s[i] i >= s.length将返回undefined,条件将返回true

&#13;
&#13;
document.body.innerHTML += findFirstDiffPos("in he", "in the") + "<br/>";
document.body.innerHTML += findFirstDiffPos("abcd", "abcde") + "<br/>";
document.body.innerHTML += findFirstDiffPos("zxc", "zxc");

function findFirstDiffPos(a, b)
{
  var longerLength = Math.max(a.length, b.length);
  for (var i = 0; i < longerLength; i++)
  {
     if (a[i] !== b[i]) return i;
  }

  return -1;
}
&#13;
&#13;
&#13;

答案 2 :(得分:2)

该功能可以使用一些ES5功能:

function firstDiff(a, b) {
  var idx;

  // Short ciruit if strings are the same
  if (a == b) return -1;

  // Go until difference found
  a.split('').every(function (c, i) {
    idx = i;
    return c == b[i]; 
  });
  return idx;
}

这将在最短字符串的末尾自动返回。

修改

一些代码高尔夫导致以下内容:

// Concise for loop
function firstDiff(a, b) {
  for (var i=0; i<a.length; i++)
    if (a[i] != b[i]) return i;
  return i<b.length? i : -1;
}

或使用ECMAScript 2015 findIndex

function firstDiff(a, b) {
  var i = a.split('').findIndex(function(c, i) {return c != b[i]});
  return a == b? -1 : i == -1? a.length : i;
}

但也许可读性受到影响。选择的标准是什么?

对于torazaburo的while循环工作的循环版本(使用基本方法是值得的,因为它们通常比迭代器快得多,而且代码不多,如果有的话):

function findFirstDiffPos(a, b) {
  if (a === b) return -1;
  for (var i=0; a[i] == b[i]; i++) {}
  return i;
}

答案 3 :(得分:0)

为了好玩,这里有一个班轮。虽然不是特别可读

const findFirstDiffPos = (a, b) => [a, b].sort((a, b) => b.length - a.length).reduce((a, b) => [...a].findIndex((c, i) => c !== b[i]))