使用python进行网络抓取时如何解码[email \ xa0protected]

时间:2019-09-25 17:15:10

标签: python web-scraping

当我尝试使用python lxml.html从以下标记中提取邮件ID时,它显示[email \ xa0protected],任何人都可以帮助我对其进行解码。

<a href="/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="4420366a373021283e2136042921202d27212a30262520212a6a272b29">[email&#160;protected]</a>

1 个答案:

答案 0 :(得分:0)

最后我得到了答案

def deCFEmail(fp):
try:
    r = int(fp[:2],16)
    email = ''.join([chr(int(fp[i:i+2], 16) ^ r) for i in range(2, len(fp), 2)])
    return email
except (ValueError):
    pass

使用上述代码,我们可以将CloudFare的base58值解码为文本。

例如: s ='您的58基值'

打印(deCFEmail)

谢谢