正则表达式以查找带有数字和字母的单词(哈希)

时间:2019-01-22 13:31:54

标签: python regex

我有一组字符串,其中一些包含带有数字和字母的“单词”,例如:

  

将Push Diamond刻度标记类还原为Eclipse,这将还原提交4086b8666cdc839b5ec7e7bfff0ae1b9695542ff .......

是否存在一些正则表达式来删除这些单词(哈希)?

1 个答案:

答案 0 :(得分:1)

您可以寻找具有所需长度的空格分隔的十六进制字符序列,例如在3050个字符之间。例如:

import re

text = """Revert Push Diamond tick mark classes to Eclipse This reverts commit 
4086b8666cdc839b5ec7e7bfff0ae1b9695542ff .......
Another test
48a8b89d9f8e80a938f8ab487de09ff
"""

for hash in re.findall(r'\s+([0-9a-fA-F]{30,50})\s+', text):
    print(hash)

将显示:

4086b8666cdc839b5ec7e7bfff0ae1b9695542ff
48a8b89d9f8e80a938f8ab487de09ff