如何使用Beautiful Soup获取CSS链接

时间:2018-02-22 22:15:04

标签: python regex python-3.x beautifulsoup

我有一个webpage,我正在使用美丽的汤。我有HTML,但现在我需要CSS。我尝试过使用soup.findAll('link', {'rel': 'stylesheet'}),但我可以弄清楚如何从返回列表的第一个索引中获取文件名,<link href="styles.css" rel="stylesheet"/>

我尝试使用正则表达式,我不是很擅长,但我不知道如何让它工作。

那么,是否有一个我可以使用的BeautifulSoup功能,或者我必须走我已经采取的路线?

1 个答案:

答案 0 :(得分:3)

如果你正在使用BeautifulSoup4

for link in soup.find_all('link', href=True):
    print "Found the URL:", link['href']

如果您使用的是版本3

for link in soup.findAll('link', href=True):
    print "Found the URL:", link['href']