我想使用RegEx删除不必要的ZWNJ,目前我在某些情况下硬编码了一些不需要ZWNJ的字符,但是如何将它扩展到所有这些字符?
preg_replace('#(?<=[ادذرزژوآأإءa-zA-Z])\x{u200C}#u', '', $parsi);
当ZWNJ置于两个角色之间时 连接成结扎线,ZWNJ使它们被打印出来 最终形式和初始形式。这也是一种效果 空格字符,但是当需要保留时,使用ZWNJ 更接近的话。
如果我们需要将问题限制为阿拉伯语脚本,是否有任何RegEx元字符代表没有内侧形式的字母(等等不需要后续的ZWNJ)?
答案 0 :(得分:-1)
作为一名非阿拉伯人,这不是我的专业领域,但...... Here我找到了一些关于阿拉伯语unicode字符的信息。
我建议你做一些事情:
[\u0600-\u065F\u066A-\u06EF\u06FA-\u06FF]
选择所有阿拉伯字母。