如果数组中的字符串不匹配,请从字符串中删除字符串字符

Remove string characters from a string if not matched in an array

本文关键字:字符串 字符 删除 不匹配 数组 如果      更新时间:2023-09-26

我正在尝试循环一个数组,其中包含我希望我的输入字符串与之进行比较的字符串。所以方法是我循环访问一个输入字符串以检查每个字符是否与数组中存在的元素之一匹配。如果不是,只需将该字符替换为"。注意:正则表达式实际上不是一个选项。

这是我的JavaScript

的样子
var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|' ';
input.toLowerCase(input)
var allowed = ['0','1','2','3','4','5','6','7','8','9','a','b','c','d', 'e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','s','à','â','ä','è','é','ê','ë','î','ï','ô','œ','ù','û','ü','ÿ','ç','À','Â','Ä','È','É','Ê','Ë','Î','Ï','Ô','Œ','Ù','Û','Ü','Ÿ','Ç', ' '] 
var cleanStr = '';
for(var i = 0; i < input.length; i++){
    for(var j = 0; j< allowed.length; j++){
    if(input[i] !== allowed[j]){
        cleanStr = input.replace(input[i], ' ');
      console.log(cleanStr);
    }
  }
}

控制台日志输出似乎与输入字段没有任何不同。我错过了什么?

这是我的小提琴

https://jsfiddle.net/sghoush1/nvnk7r9j/4/

您可以在单个循环中执行此操作。

var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|' ';
input = input.toLowerCase(); // Note the syntax here
var allowed = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 'à', 'â', 'ä', 'è', 'é', 'ê', 'ë', 'î', 'ï', 'ô', 'œ', 'ù', 'û', 'ü', 'ÿ', 'ç', 'À', 'Â', 'Ä', 'È', 'É', 'Ê', 'Ë', 'Î', 'Ï', 'Ô', 'Œ', 'Ù', 'Û', 'Ü', 'Ÿ', 'Ç', ' '];
var cleanStr = '';
// Loop over each character in the string
for (var i = 0; i<input.length; i++) {
    // Check if the character is allowed or not
    if (allowed.indexOf(input[i]) !== -1) {
        // Concat the allowed character to result string
        cleanStr += input[i];
    }
}
console.log(cleanStr);
document.body.innerHTML = cleanStr;


正则表达式方法:

您可以使用 RegExp 构造函数从字符串创建正则表达式。要替换不允许的字符,可以使用否定字符类 RegEx。

var regex = new RegExp('[^' + allowed.join('') + ']', 'g');
var cleanStr = input.replace(regex, '');

注意:您需要转义 Character 类中具有特殊含义的元字符。

字符

类中前面的反斜杠'转义所需的元字符 引用自 www.regular-expressions.info

在大多数正则表达式风格中,字符类中唯一的特殊字符或元字符是右括号 (](、反斜杠 ('(、插入符号 ( ^ ( 和连字符 ( - (。

var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|' ';
var allowed = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 's', 'à', 'â', 'ä', 'è', 'é', 'ê', 'ë', 'î', 'ï', 'ô', 'œ', 'ù', 'û', 'ü', 'ÿ', 'ç', 'À', 'Â', 'Ä', 'È', 'É', 'Ê', 'Ë', 'Î', 'Ï', 'Ô', 'Œ', 'Ù', 'Û', 'Ü', 'Ÿ', 'Ç', ' '];
var regex = new RegExp('[^' + allowed.join('') + ']', 'gi');
console.log(regex);
var cleanStr = input.replace(regex, '');
console.log(cleanStr);

如果允许的字符数组是固定的,则可以使用以下正则表达式来替换不允许的字符。此外,无需将字符串转换为小写,请使用i标志进行不区分大小写的匹配。

var regex = /[^0-9a-zàâäèéêëîïôœùûüÿç ]/gi;

正则表达式101现场演示

使用 ES6 的 Set 类,在所有好的浏览器中都可用:

let input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|' '.toLowerCase();
let allowed = new Set(['0','1','2','3','4','5','6','7','8','9','a','b','c','d', 'e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','s','à','â','ä','è','é','ê','ë','î','ï','ô','œ','ù','û','ü','ÿ','ç','À','Â','Ä','È','É','Ê','Ë','Î','Ï','Ô','Œ','Ù','Û','Ü','Ÿ','Ç', ' ']);
let cleanStr = [].map.call(input, c => allowed.has(c) ? c : ' ').join('');

最后一行使用有效的Set查找操作来确定是否允许该字符。

[].map.call(input, ...)允许Array.prototype.map函数直接对输入字符串进行操作。 由于结果是一个数组,因此之后需要将其重新join在一起。

在算法复杂性方面,这使用两个O(n)数组操作,n设置查找 - 我不知道它们有多复杂,但可能会O(log n)甚至O(1),具体取决于实现。

当然,创建初始Set也有计算成本,但它是微不足道的,应该只执行一次,例如在程序启动时。

相反,如果您确实想删除不匹配的字符,则可以使用.filter而不是.map

let cleanStr = [].filter.call(input, c => allowed.has(c)).join('');
好的,

所以你的代码的问题在于,每次循环检查是否允许输入的元素时,你都会cleanStr分配给输入,只有该字符更改为空字符串元素。请记住,在每个循环中,您的输入始终相同,clearStr是您上次替换的结果。因此,您实际上丢弃了到目前为止所做的所有替换,并且在计算结束时,您将拥有仅包含您所做的最后一次替换的输入字符串。您要做的是增量构建生成的字符串,以便在循环结束时获得预期的结果。

var input = 'this is A [{}].-_+~`:; *6^123@#$%&*()?{}|' ';
input.toLowerCase(input)
var allowed = ['0','1','2','3','4','5','6','7','8','9','a','b','c','d', 'e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','s','à','â','ä','è','é','ê','ë','î','ï','ô','œ','ù','û','ü','ÿ','ç','À','Â','Ä','È','É','Ê','Ë','Î','Ï','Ô','Œ','Ù','Û','Ü','Ÿ','Ç', ' '] 
var cleanStr = '';
for(var i = 0; i < input.length; i++){
  if(allowed.indexOf(input[i]) !== -1){
        cleanStr += input[i];
  }
}
console.log(cleanStr);

我认为对你来说,了解你的错误是什么很重要。除了您可以使用 js 的一些内置函数来避免如此简单的任务出现双 for 循环之外。尽管正如许多人建议的那样,正则表达式会更有效率。