我想为这些输入样本编写一个正则表达式:
اشک12345
اشکـ12345
我的想法:
"^[آ-ی][آ-ی][آ-ی][\ـ]?\d{5}"
但它不起作用。
答案 0 :(得分:8)
尝试使用另一个正则表达式:
[0-9]*[\u0600-\u06FF]*
或者
[\u0600-\u06FF]*[ـ]?[\d{5}]+
甚至
[\w{Arabic}]*[ـ]?[\d{5}]+
匹配2组你可以使用
(?'head'[\w{Arabic}]{3})[ـ]?(?'index'[\d{5}]+)
结果将是两组:
head: اشک
index: 12345