如何做正则表达式从HTML文件中提取字符串

时间:2019-03-19 02:28:13

标签: python html

我仍然不知道如何提取这样的链接:

http: example.com/AA-HDCM-300B.pdf

由于我要提取以"AA-HDCM-300B"开头的产品部件号"AA-"

有人会提取代码吗?

1 个答案:

答案 0 :(得分:0)

import re

url = 'dview.com/IDVIEW/Products/Cameras/Covert/assets/IV-PC229XP.pdf'
result = re.findall('(IV.*)\.', url)

输出:

IV-PC229XP