我有一个ID列表,如:
A5ukur+de2.008x١٥١١٠٦١١٥٠٥٢٤٦٢
我编写了以下使用组名
的命令>>> RE_SID = re.compile(ur'(?P<sid>(?<=sid:)([A-Za-z0-9+.\u0627-\u064a]+))',re.UNICODE)
>>> x = RE_SID.search('sid:A5ukur+de2.008x١٥١١٠٦١١٥٠٥٢٤٦٢">>')
>>> x.group('sid')
'A5ukur+de2.008x'
然而,当波斯语/阿拉伯字母与拉丁字符组合时,这不起作用,而这仅仅归还A5ukur+de2.008x
。
我将不胜感激任何帮助。