BeautifulSoup:如何提取内容?

时间:2016-09-21 12:36:25

标签: python css-selectors beautifulsoup html-parsing

我试图解析的网站上的

是这样的标签:

<a class="sku" href="http://pl.farnell.com/tdk/c3225x6s0j107m250ac/capacitor-mlcc-x6s-100uf-6-3v/dp/2526286" title="2526286">2526286</a>

我想获得他们的内容列表(这里是2526286值)。我怎样才能做到这一点?我试过

for node in soup.find_all('a', {'class': 'sku'}):
print(node.content)

但是对于找到的每个标签都会返回“无”。

1 个答案:

答案 0 :(得分:2)

您可以使用:

for node in soup.find_all('a', {'class': 'sku'}):
    print(node.string)

整个代码:

from bs4 import BeautifulSoup

string = """
<div>
    <a class="sku" href="http://pl.farnell.com/tdk/c3225x6s0j107m250ac/capacitor-mlcc-x6s-100uf-6-3v/dp/2526286" title="2526286">2526286</a>
</div>
"""
soup = BeautifulSoup(string, "lxml")
for node in soup.find_all('a', {'class': 'sku'}):
    print(node.string)