python regex查找并哈希用户名

时间:2018-10-29 11:07:18

标签: python regex

我想在日志文件中hash usernames-我的正则表达式无法正常工作

输入示例:

Account Name:  -  Account Domain: - ImportantStuff Account Name:  Foo bar  Account Domain: my.bar
Account Name:  Foo-bar  Supplied Realm Name: my.bar ImportantStuff 
Account Name:  Foo99bar$  Account Domain: my.bar ImportantStuff Account Name:  -  Account Domain: -

我的正则表达式:

(((?!Account Name:\s+-\s+))(Account Name:\s+(\S+.+(?=\s+Account))))|(Account Name:\s+(\S+.+(?=\s+Supplied)))((?!Account Name:\s+-\s+))

我想过滤为:

  • 如果模式“帐户名:-”忽略

  • 如果模式不是“帐户名:-”,则获取用户名

我不能过滤“-”作为分隔符,因为某些用户名包含“-”,这就是为什么我使用\ s- \ s(?!ignore Pattern)。空格也是如此。

之后,用户名将被散列:

result2 = re.sub(r'(((?!Account Name:\s+-\s+))(Account Name:\s+(\S+.+(?=\s+Account))))|(Account Name:\s+(\S+.+(?=\s+Supplied)))((?!Account Name:\s+-\s+))', lambda m: m.group(1) + hashlib.sha512(m.group(2)).hexdigest(), line)

起初,我尝试使用[^ Account Name:\ s +-\ s +],但是当然,所有内容都已匹配,这不在[^]之内,也不被视为字符串。

我可以这样做吗? :

((?!Account Name: - )|Account Name:\s+(.+?(?=\s+Account Domain|Supplied)))

我正在跑步python 2.7

2 个答案:

答案 0 :(得分:1)

Account Name:后接(?!\s+-\s)否定的空白时,您可能会失败所有匹配:

(Account Name:(?!\s+-\s)\s*)(.*?)(?=\s+(?:Account Domain|Supplied))

请参见regex demo

详细信息

  • (Account Name:(?!\s+-\s)\s*)-第1组:Account Name:,紧随其后的是1+个空格,-和一个空格((?!\s+-\s)),然后是0+空格
  • (.*?)-第2组:除换行符以外的任何零个或多个字符,并且尽可能少
  • (?=\s+(?:Account Domain|Supplied))-正向超前,需要1个以上的空格,后跟当前位置右侧的Account DomainSupplied子字符串。

请参见Python 2 demo

import re,hashlib
l = ['Account Name:  -  Account Domain: - ImportantStuff Account Name:  Foo bar  Account Domain: my.bar','Account Name:  Foo-bar  Supplied Realm Name: my.bar ImportantStuff','Account Name:  Foo99bar$  Account Domain: my.bar ImportantStuff Account Name:  -  Account Domain: -']
for line in l:
    print(re.sub(r'(Account Name:(?!\s+-\s)\s*)(.*?)(?=\s+(?:Account Domain|Supplied))',
        lambda m: m.group(1) + hashlib.sha512(m.group(2)).hexdigest(), line))

输出:

Account Name:  -  Account Domain: - ImportantStuff Account Name:  45a19ebf5c5c04bf71e9819b29e9a71ee7b4f9b5d3de72615b9788da05eceb526cc47b18e108107a3e53ee2068c4da4fca8209e9e2d87560d6848823eebe803b  Account Domain: my.bar
Account Name:  4ac1e08061b7216e9d3e0a44d6ca6512a25577a1e0675ba7cb439fc243e84d566dd0c1aac33f89c5c23e959fef5dc6a71cdd2adba257c81975caa822be4e5018Supplied Realm Name: my.bar ImportantStuff
Account Name:  7228cb36d1d3b5cd41d50d150defd13e06441eb2b6a4689f9356012607fb0ebf5680af49f743baf289a590a07f8da6077f5288a5d4000448bfc7fd303869d31f  Account Domain: my.bar ImportantStuff Account Name:  -  Account Domain: -

答案 1 :(得分:0)

最好先将其分解为多个问题。

由于您的日志具有相同的结构(我在这里假设您的用户名没有空格)。所以先按块分割。

然后,您的用户名将始终位于特定的块上。

在此特定块上,您甚至可以使用更简单的正则表达式应用任何规则。