我有一个webpage,我正在使用美丽的汤。我有HTML,但现在我需要CSS。我尝试过使用soup.findAll('link', {'rel': 'stylesheet'})
,但我可以弄清楚如何从返回列表的第一个索引中获取文件名,<link href="styles.css" rel="stylesheet"/>
我尝试使用正则表达式,我不是很擅长,但我不知道如何让它工作。
那么,是否有一个我可以使用的BeautifulSoup功能,或者我必须走我已经采取的路线?
答案 0 :(得分:3)
如果你正在使用BeautifulSoup4
for link in soup.find_all('link', href=True):
print "Found the URL:", link['href']
如果您使用的是版本3
for link in soup.findAll('link', href=True):
print "Found the URL:", link['href']