如何从python中不必要的Html Wrapping中提取密钥

时间:2009-08-31 09:46:29

标签: python

包含密钥和一些\ n字符的HTML页面。我只需要使用密钥块,即从----- BEGIN PGP PUBLIC KEY BLOCK -----到----- END PGP PUBLIC KEY BLOCK ----- 将提取密钥放入文件后,我可以在任何函数中传递它....

1 个答案:

答案 0 :(得分:0)

以最简单的形式

import re
clean = re.sub("</?[^\W].{0,10}?>|\n|\r\n", "", your_html) #remove tags and newlines
key = re.search(r'BEGIN PGP PUBLIC KEY BLOCK.+?END PGP PUBLIC KEY BLOCK', clean)

或者如果您不需要BEGIN PGP ... BLOCKEND PGP ... BLOCK

key = re.search(r'BEGIN PGP PUBLIC KEY BLOCK----(.+?)----END PGP PUBLIC KEY BLOCK',clean)

这就是你要追求的吗? (我这里没有python来检查它,但我希望它没关系)