无法从网页的某些xml内容中获取链接

时间:2019-01-14 18:31:16

标签: python xml python-3.x web-scraping beautifulsoup

我已经用python编写了一个脚本,以从网页的xml内容中刮出不同的链接,但是执行以下脚本时,我什么也没有得到。

我应该进行哪些纠正才能产生结果?

website link

这种包含链接的xml分散块:

<loc>
    https://www.bhphotovideo.com/c/product/163666-REG/Rosco_150053860016_Off_Broadway_Paint.html
</loc>

我的尝试(脚本不会产生任何结果,也不会引发任何错误):

import requests
from bs4 import BeautifulSoup

link = 'https://www.bhphotovideo.com/SiteMap1.xml'

res = requests.get(link,headers={"User-Agent":"Mozilla/5.0"})
soup = BeautifulSoup(res.content,"xml")
for item in soup.select("url loc"):
    print(item.text)

0 个答案:

没有答案