我正在使用python使用正则表达式解析SDDL。 SDDL始终采用“类型:某些文本”的形式重复最多4次。类型可以是“O”,“G”,“D”或“S”后跟冒号。 “some text”的长度可变。
以下是SDDL示例:
O:DAG:S-1-5-21-2021943911-1813009066-4215039422-1735D:(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)S:NO_ACCESS_CONTROL
这是我到目前为止所拥有的。其中两个元组返回正常,但另外两个 - ('G','S-1-5-21-2021943911-1813009066-4215039422-1735')和('S','NO_ACCESS_CONTROL')不是。
import re
sddl="O:DAG:S-1-5-21-2021943911-1813009066-4215039422-1735D:(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)S:NO_ACCESS_CONTROL"
matches = re.findall('(.):(.*?).:',sddl)
print matches
[('O', 'DA'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)')]
我想要归还的是
[('O', 'DA'), ('G','S-1-5-21-2021943911-1813009066-4215039422-1735'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)'),('S','NO_ACCESS_CONTROL')]
答案 0 :(得分:2)
尝试以下方法:
(.):(.*?)(?=.:|$)
示例:
>>> re.findall(r'(.):(.*?)(?=.:|$)', sddl)
[('O', 'DA'), ('G', 'S-1-5-21-2021943911-1813009066-4215039422-1735'), ('D', '(D;;0xf0007;;;AN)(D;;0xf0007;;;BG)'), ('S', 'NO_ACCESS_CONTROL')]
此正则表达式与您的正则表达式相同,但不是将.:
作为匹配的一部分包含在最后,而是使用前瞻。这是必要的,因为re.findall()
不会返回重叠匹配,因此您需要在下一场比赛开始前停止每场比赛。
前瞻(?=.:|$)
实质上意味着“仅当下一个字符后面跟冒号后才匹配,或者我们位于字符串的末尾”。
答案 1 :(得分:0)
似乎使用正则表达式并不是解决此问题的最佳方法。实际上,您要做的就是分割冒号,然后对结果列表进行一些转换。
chunks = sddl.split(':')
pairs = [(chunks[i][-1], chunks[i+1][:-1] \
if i < (len(chunks) - 2) \
else chunks[i+1])
for i in range(0, len(chunks) - 1)]