带有印度字符的正则表达式

Regular expressions with Indian characters

本文关键字:正则表达式 字符      更新时间:2023-09-26

我想知道是否可以为印度字符编写正则表达式?我想验证给定的字符是否是印度字母或数字。我发现了两个问题:

印地语重音字符的unicode范围是多少?

印度-阿拉伯数字utf8从0到9的范围是多少

所以我尝试了这个:''x{0600}-''x{06ff}

但如果我搜索此文本(在OpenOffice中):http://pastebin.com/mDHL69XH使用此:''x{0600}-''x{06ff}什么也没找到。。。

好吧,这应该做

['u0900-'u097F]+// 'uFFFF format supported by Java,.net

['u{0900}-'u{097F}]+// 'u{FFFF} format supported by perl,pcre

'p{Devanagari}//not widely supported