python中阿拉伯语的正则表达式

时间:2016-12-28 09:44:18

标签: python-2.7 arabic

我写了这段代码来解码任何像“أنامبسوطة”这样的子串 问题是可以接受“أناسيشسيسشيمبسوطة”

 s=ur"أنا  سيشسيسشي مبسوطة  "
        pattern=ur"أنا"+"\s"+".*"+ur"ة"
        l=re.findall(pattern,s)
        print(pattern)
        for tweet in l:
           print(tweet)
        length=l.__len__()
        if (length>0):
           print ("true",length)
        else:
           print ("false")

如果输入“أناسيشسيسشيمبسوطة”false,如果输入“أنامبسوطة”,我希望输出为true。我正在使用python 2

1 个答案:

答案 0 :(得分:0)

您可以改用以下模式:

pattern=ur"أنا"+"\s*"+ur"[ا-ي]*"+ur"ة"