在python中使用正则表达式的问题。刮除后无法打印确切的所需内容

时间:2018-05-11 07:08:54

标签: python web-scraping

html = urlopen("http://pythonscraping.com/pages/page3.html")
soup = BeautifulSoup(html,'lxml')
images = soup.findAll("img", 
{"src":re.compile("\.\.\/img\/gifts\/img.*\.jpg") })

for image in images:
    x=(image['src'])
    print(x)

    mage = re.findall("^\.\. (\/img\/gifts\/img.*\.jpg)",x)
    print(mage)

=============================================== =======================

在上面的代码中输出是 ../img/gifts/img1.jpg [] ../img/gifts/img2.jpg [] ../img/gifts/img3.jpg [] ../img/gifts/img4.jpg [] ../img/gifts/img6.jpg []

然而,我把print(mage)短语和代码去掉了print(x)输出中的前两个点

有人可以帮我解决这个问题吗?为什么我得到空[]。如果有任何错误,请帮我处理代码

我正在使用pycharm来运行此代码

0 个答案:

没有答案