我在这样的表中有一些HTML代码:
<html>
<head></head>
<body>
<tr>
<td class="class1">data1<td/>
<td class="class2">data2<td/>
<td class="class3">data3<td/>
<td class="class4">data4<td/>
<td class="class5">data5<td/>
</tr>
</body>
</html>
如何使用漂亮的汤来获取特定类的数据/字符串?
当我使用print(soup.body.td)
时,我只会得到第一个结果。
答案 0 :(得分:0)
尝试一下:
from bs4 import BeautifulSoup
html = '''<html>
<head></head>
<body>
<tr>
<td class="class1">data1<td/>
<td class="class2">data2<td/>
<td class="class3">data3<td/>
<td class="class4">data4<td/>
<td class="class5">data5<td/>
</tr>
</body>
</html>'''
soup = BeautifulSoup(html, 'lxml')
results = soup.find("td", {"class" : "class1"})
print(results.text)