我已经用python编写了一个脚本,以从网页的xml内容中刮出不同的链接,但是执行以下脚本时,我什么也没有得到。
我应该进行哪些纠正才能产生结果?
这种包含链接的xml分散块:
<loc>
https://www.bhphotovideo.com/c/product/163666-REG/Rosco_150053860016_Off_Broadway_Paint.html
</loc>
我的尝试(脚本不会产生任何结果,也不会引发任何错误):
import requests
from bs4 import BeautifulSoup
link = 'https://www.bhphotovideo.com/SiteMap1.xml'
res = requests.get(link,headers={"User-Agent":"Mozilla/5.0"})
soup = BeautifulSoup(res.content,"xml")
for item in soup.select("url loc"):
print(item.text)