如果数组中不匹配,则从字符串中删除字符串字符

时间:2016-02-12 16:23:51

标签: javascript

我试图遍历一个包含我想要输入字符串进行比较的字符串的数组。因此,方法是循环输入字符串以检查每个字符是否与数组中存在的元素之一匹配。如果不是仅用'替换该字符。注意:正则表达式实际上不是一个选项。

以下是我的JavaScript的样子

using System;
using System.Reactive.Concurrency;
using System.Reactive.Linq;
using System.Threading;

class Program
{
    static void Main(string[] args)
    {
        var instance = ThreadPoolScheduler.Instance;
        var cts = new CancellationTokenSource(TimeSpan.FromSeconds(5));

        Observable.Interval(TimeSpan.FromSeconds(0.5), instance)
            .Subscribe(_ => Console.WriteLine(DateTime.UtcNow), cts.Token);
        Thread.Sleep(10000);
    }
}

控制台日志输出似乎与输入字段不同。我错过了什么?

这是我的小提琴

http://bootstrap-wysiwyg.github.io/bootstrap3-wysiwyg/

3 个答案:

答案 0 :(得分:4)

您可以在一个循环中完成此操作。



var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|\ ';
input = input.toLowerCase(); // Note the syntax here

var allowed = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 'à', 'â', 'ä', 'è', 'é', 'ê', 'ë', 'î', 'ï', 'ô', 'œ', 'ù', 'û', 'ü', 'ÿ', 'ç', 'À', 'Â', 'Ä', 'È', 'É', 'Ê', 'Ë', 'Î', 'Ï', 'Ô', 'Œ', 'Ù', 'Û', 'Ü', 'Ÿ', 'Ç', ' '];

var cleanStr = '';

// Loop over each character in the string
for (var i = 0; i<input.length; i++) {

    // Check if the character is allowed or not
    if (allowed.indexOf(input[i]) !== -1) {
        // Concat the allowed character to result string
        cleanStr += input[i];
    }
}

console.log(cleanStr);
document.body.innerHTML = cleanStr;
&#13;
&#13;
&#13;

RegEx方法:

您可以使用RegExp构造函数从字符串创建RegEx。要替换不允许的字符,可以使用negated character class RegEx。

var regex = new RegExp('[^' + allowed.join('') + ']', 'g');
var cleanStr = input.replace(regex, '');

注意:您需要转义在Character类中具有特殊含义的元字符。

character class 引用来自www.regular-expressions.info 的前导反斜杠\需要转义的元字符。

  

在大多数正则表达式中,字符类中唯一的特殊字符或元字符是右括号(]),反斜杠(\),插入符号(^),和连字符(-)。

&#13;
&#13;
var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|\ ';
var allowed = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 's', 'à', 'â', 'ä', 'è', 'é', 'ê', 'ë', 'î', 'ï', 'ô', 'œ', 'ù', 'û', 'ü', 'ÿ', 'ç', 'À', 'Â', 'Ä', 'È', 'É', 'Ê', 'Ë', 'Î', 'Ï', 'Ô', 'Œ', 'Ù', 'Û', 'Ü', 'Ÿ', 'Ç', ' '];

var regex = new RegExp('[^' + allowed.join('') + ']', 'gi');
console.log(regex);

var cleanStr = input.replace(regex, '');
console.log(cleanStr);
&#13;
&#13;
&#13;

如果修复了允许的字符数组,则可以使用以下RegEx替换不允许的字符。此外,无需将字符串转换为小写,使用i标志进行不区分大小写的匹配。

var regex = /[^0-9a-zàâäèéêëîïôœùûüÿç ]/gi;

RegEx101 Live Demo

答案 1 :(得分:4)

使用ES6的Set课程,可在all good browsers中找到:

let input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|\ '.toLowerCase();
let allowed = new Set(['0','1','2','3','4','5','6','7','8','9','a','b','c','d', 'e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','s','à','â','ä','è','é','ê','ë','î','ï','ô','œ','ù','û','ü','ÿ','ç','À','Â','Ä','È','É','Ê','Ë','Î','Ï','Ô','Œ','Ù','Û','Ü','Ÿ','Ç', ' ']);

let cleanStr = [].map.call(input, c => allowed.has(c) ? c : ' ').join('');

最后一行使用高效的Set查找操作来确定是否允许该字符。

[].map.call(input, ...)允许Array.prototype.map函数直接在输入字符串上操作。由于结果是一个数组,因此需要将join重新组合在一起。

在算法复杂性术语中,这使用了两个O(n)数组操作,n设置查找 - 我不知道它们有多么复杂但它很可能O(log n)或者可能甚至O(1),具体取决于实施情况。

当然,初始Set的创建也有计算成本,但它很简单,应该只进行一次,例如:程序启动时。

如果您确实想删除不匹配的字符,则可以使用.filter代替.map

let cleanStr = [].filter.call(input, c => allowed.has(c)).join('');

答案 2 :(得分:1)

好的,所以代码的问题在于,每次循环检查是否允许输入元素时,都会将cleanStr分配给输入,只将该字符更改为空字符串元素。请记住,在每个循环中,您的输入始终相同,clearStr是您最后一次替换的结果。所以你实际上扔掉了到目前为止所做的每一次更换,并且在计算结束时你将得到输入字符串,只有你做的最后一次替换。你想要做的是逐步构建结果字符串,以便在循环结束时得到你期望的结果。

var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|\ ';
input.toLowerCase(input)

var allowed = ['0','1','2','3','4','5','6','7','8','9','a','b','c','d', 'e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','s','à','â','ä','è','é','ê','ë','î','ï','ô','œ','ù','û','ü','ÿ','ç','À','Â','Ä','È','É','Ê','Ë','Î','Ï','Ô','Œ','Ù','Û','Ü','Ÿ','Ç', ' '] 

var cleanStr = '';
for(var i = 0; i < input.length; i++){
  if(allowed.indexOf(input[i]) !== -1){
        cleanStr += input[i];
  }
}

console.log(cleanStr);

我认为你理解你的错误是很重要的。除了你可以使用js的一些内置函数以避免这样一个简单任务的双循环之外的事实。虽然许多人认为正则表达式会更有效率。