如何从 JavaScript 中的字符串中获取唯一字符列表
how to get list of unique chars from a string in javascript?
我有一些文本文件,每个文件都混合了西方和中文字符。我想要每个文件中出现的中文字符列表。
我试过了
ch = text.match(/['u4E00-'u9FFF]/g); // unicode usual chinese characters - that'll do for me
if (ch != null) {
alert(ch);
}
这给了我汉字列表,但有一些重复。例如:
肉,捕,兵,死,兵,半,水
对于文件
卵,水,半,水,土,木,水,清,慢,底,海,海,海,清,清,清,木,清,慢,底,清,土,半,水,水,土,半,水,土
对于另一个...
1)我不需要那些逗号。他们从哪里来?(我可以通过一个替换将它们取下,但由于我使用的是正则表达式,我认为如果我在正则表达式本身内解决它可能会更快。
2) 如何只获取唯一值?例如:
肉捕兵死半水
对于第一个文件
卵水半土木清慢底海
对于第二个...
逗
号来自默认数组到字符串的转换。 改用ch.join('')
将数组转换为字符串。
若要删除重复值,请使用以下行:
ch = text.match(/(['u4E00-'u9FFF])/g);
ch = ch.filter(function (c, i) { return ch.indexOf(c) === i; }).join('');
Array.prototype.getUnique = function(){
var u = {}, a = [];
for(var i = 0, l = this.length; i < l; ++i){
if(u.hasOwnProperty(this[i])) {
continue;
}
a.push(this[i]);
u[this[i]] = 1;
}
return a;
}
ch = text.match(/(['u4E00-'u9FFF])/g);
var result_string = ch.getUnique().join("");
试试这个:
var text = "卵水半水土木水清慢底海海海清清清木清慢底清土半水水土半水土",
re = /(['u4E00-'u9FFF])/g,
unique = {},
chars = "", c;
while(c = re.exec(text)){
if(!unique[c[0]]){
chars += c[0];
unique[c[0]] = true;
}
}
chars.split("");
其中返回:
["卵", "水", "半", "土", "木", "清", "慢", "底", "海"]
是的,您看到的逗号是浏览器将数组类型转换为字符串时:它将每个值的字符串表示形式与逗号连接在一起。我猜这来自原始示例中对"alert"的调用,该示例提供了一个数组(从字符串的"Match"方法返回)。
Array 的"filter"方法在旧版浏览器中不受支持,但它很容易填充(如果您只关心最新的 IE9 支持代理,当然没有必要)。
有一个
带有正则表达式的单行解决方案:
input.match(/(['u4E00-'u9FFF])(?!['s'S]*'1)/g)
但是,我不建议使用它,因为在最坏的情况下(当字符串主要包含中文字符时),它会具有 O(n * k) 的复杂性,其中 n 是字符串的长度,k 是唯一中文字符的数量。为什么是O(n * k)?由于前瞻(?!['s'S]*'1)
基本上说"断言您无法在字符串的其余部分找到与第一个捕获组匹配的任何内容的另一个实例"。
@Ruben·卡祖莫夫的这个答案是一个合理的选择。它的复杂性取决于在 Object 中设置和获取属性的实现,在合理的实现中,每个操作应该是亚线性的。
相关文章:
- 在数据库中循环值时,为输入框获取唯一值
- 获取唯一值并使用javascript计算金额总和
- JavaScript:从对象数组中获取唯一值及其计数
- 获取唯一的项目-Handlebars
- 上传时获取唯一号码
- 基于单个属性从数组中获取唯一对象
- 从jQuery .change上具有相同类的不同复选框中获取唯一字段
- 从多个对象获取唯一键
- 如何从 JavaScript 中的字符串中获取唯一字符列表
- 从对象数组中获取唯一元素数组
- 基于两个属性从 javascript 中的对象数组中获取唯一数组
- 如何在 jQuery 中获取唯一项
- 从嵌套数组中获取唯一元素的 JS 模式是什么
- PouchDB:创建一个设计文档来获取唯一键
- 在循环期间获取唯一值
- 从对象的两个数组中获取唯一值,并将它们放在另一个数组中
- 无法在卡数组中获取唯一值
- 在JavaScript(NodeJS)中从MongoDB ObjectId中获取唯一的int
- 获取唯一的类名并在其中循环
- 如何在jquery中获取唯一选择器