Question

我有两个字符串，string1和string2。我想检查string1是否可以由string2中的字符组成（不重复字符“）。例如，如果string1是”tool“而string2是”atoll“，则函数将返回false。如果string1是”touch“， string2是“chetoudce”，它将返回true。

在Javascript中执行此操作的最有效方法是什么？我正在考虑使用indexOf然后删除string2中使用的字符来构建string1，但我认为创建这个辅助字符串可能会出现性能问题。

编辑：我根据第一个回复做了这个，这里是：

function isSubsetOf(a, b){
    if(a.length > b.length){
        return false;
    }

    while(a.length > 0){
        var letter = a.substr(0, 1),
            re = new RegExp(a.substr(0, 1), 'g'),
            a_count = (a.match(re)||[]).length,
            b_count = (b.match(re)||[]).length;

        if(a_count > b_count){
            return false;
        }

        a = a.replace(re, '');
    }
    return true;
}

Answer 1

首先，计算每个字符串中的字符数。然后，如果超字符串的每个字符的数量大于或等于子字符串，则返回true。

O（m + n），m和n是子串和超弦的大小。

示例：

Superstring: aaaaabbbbccc
Substring: aabbcc

Superstring letters: 
    a: 5
    b: 4
    c: 3
    all others: 0
Substring letters:
    a: 2
    b: 2
    c: 2
    all others: 0

5 >= 2, 4 >= 2, 3 >= 2, so true

Answer 2

这可以在O（n）时间内完成：

string1 = "touch";
string2 = "chetoudce";

var chars = {}, l = string2.length, i;
for( i=0; i<l; i++) chars[string2[i]] = (chars[string2[i]] || 0)+1;

l = string1.length;
for( i=0; i<l; i++) {
    if( chars[string1[i]]) chars[string1[i]]--;
    else return false;
}
return true;

Answer 3

这是我的第一个想法。

function isSubsetOf(elements, set) {
   var i, l = elements.length, pos;
   set = set.split('');
   for (i = 0; i < l; i += 1) {
      pos = set.indexOf(elements.charAt(i));
      if (pos == -1) return false;
      set.splice(pos, 1);
   }
   return true;
}

/*-- Algorithm: --*/
// for each character in *elements*:
//   remove that character from an array of *set*'s characters
//   (and if not found, return false).

但是，我并不知道IE没有Array.indexOf，这使得IE在性能方面成为了一个糟糕的输家，并且indexOf功能已添加到Array.prototype 。然而，令我惊讶的是，它只是尖叫与Chrome，这显然是一个拼凑的拼接机。

我的第二个想法比我的第一个想法好很多，但在页面上没有明显优于其他想法。

function isSubsetOf2(elements, set) {
   var i, l, counts = {};
   for (i = 0, l = set.length; i < l; i += 1) {
      char = set.charAt(i);
      counts[char] = (counts[char] || 0) + 1;
   }
   for (i = 0, l = elements.length; i < l; i += 1) {
      char = elements.charAt(i);
      if (!counts[char]) return false;
      counts[char] -= 1;
   }
   return true;
}

/*-- Algorithm: --*/
// For each character in *set*:
//    increment its count in an object "map".
// For each character in *elements*
//    decrement its count in an object map
//    (and if < 0 or doesn't exist, return false)

所以，最后，我的第三个想法在Firefox中是最快的，也是一个很好的全能竞争者，尽管不同的浏览器为不同的功能显示了截然不同的速度。

function isSubsetOf3(elements, sets) {
   var e, s, el = elements.length, sl = sets.length;
   elements = elements.split('').sort();
   sets = sets.split('').sort();
   for (e = 0, s = 0; e < el; e += 1, s += 1) {
      while (s < sl && sets[s] < elements[e]) { s += 1; }
      if (s == sl || sets[s] > elements[e]) { return false };
   }
   return true;
}

/*-- Algorithm: --*/
// Sort arrays of the characters in *elements* and *set*.
// Do a logical "merge join" (cool!) and:
//    if no match is found, return false
// MERGE JOIN:
// For each character in the *elements* array ("left" input)
//    Consume one matching character from *set* ("right" input)
//       (skipping matches that are less than the character)
//    And if *set* runs out of characters or is higher than *element*, return false

如果输入已排序，则合并连接是快速的。显然，在浏览器中排序两个数组的速度比每个字符串执行多个Regex操作要快。

编辑：我刚刚意识到我的想法＃2基本上与Kolink的算法重复。但是，我的功能有一致的性能优势。在分析它们的差异时可能会发现一些有趣的结果。

另外，我发现在＃2中，我不应该移动counts[char] -= 1;一行，但我不想吹走我已经在jsperf上获得的性能结果。所以我要离开它，因为它不会不公平地扭曲结果，因为它只会损害函数的性能。

Do the speed tests yourself at jsperf！

Answer 4

这是一个简单的正则表达式解决方案。它与你的非常相似，除了它不做任何字符串操作，所以它可能会更快一些。

function check(needle, haystack) {

  var visited = {}, chr, i, re;

  for (i = needle.length; i--;) {
    chr = needle[i];
    if (visited[chr])
      continue;
    re = new RegExp(chr, 'g');
    if ((haystack.match(re) || []).length < (needle.match(re) || []).length) 
      return false;
    visited[chr] = true;
  }

  return true;  

}

http://jsbin.com/uretim/edit#preview

检查是否可以使用Javascript中另一个字符串中的字符创建字符串

4 个答案: