我有一组字符串,其中一些包含带有数字和字母的“单词”,例如:
将Push Diamond刻度标记类还原为Eclipse,这将还原提交4086b8666cdc839b5ec7e7bfff0ae1b9695542ff .......
是否存在一些正则表达式来删除这些单词(哈希)?
答案 0 :(得分:1)
您可以寻找具有所需长度的空格分隔的十六进制字符序列,例如在30
和50
个字符之间。例如:
import re
text = """Revert Push Diamond tick mark classes to Eclipse This reverts commit
4086b8666cdc839b5ec7e7bfff0ae1b9695542ff .......
Another test
48a8b89d9f8e80a938f8ab487de09ff
"""
for hash in re.findall(r'\s+([0-9a-fA-F]{30,50})\s+', text):
print(hash)
将显示:
4086b8666cdc839b5ec7e7bfff0ae1b9695542ff
48a8b89d9f8e80a938f8ab487de09ff