如何使用Beautiful Soup从具有特定类的标签中获取字符串

时间:2018-09-21 14:41:09

标签: python-3.x beautifulsoup

我在这样的表中有一些HTML代码:

<html>
  <head></head>
  <body>
    <tr>
      <td class="class1">data1<td/>
      <td class="class2">data2<td/>
      <td class="class3">data3<td/>
      <td class="class4">data4<td/>
      <td class="class5">data5<td/>
    </tr>
  </body>
</html>

如何使用漂亮的汤来获取特定类的数据/字符串? 当我使用print(soup.body.td)时,我只会得到第一个结果。

1 个答案:

答案 0 :(得分:0)

Rextester

尝试一下:

from bs4 import BeautifulSoup
html = '''<html>
  <head></head>
  <body>
    <tr>
      <td class="class1">data1<td/>
      <td class="class2">data2<td/>
      <td class="class3">data3<td/>
      <td class="class4">data4<td/>
      <td class="class5">data5<td/>
    </tr>
  </body>
</html>'''

soup = BeautifulSoup(html, 'lxml')
results = soup.find("td", {"class" : "class1"})
print(results.text)