假设我想解析页面中所有href中的文本,但我的代码似乎不起作用。 在我要解析的html文档中有一些像这样的代码片段。
<td class="alt1" id="ID" title="SOMETEXT">
<div>
<a href="THETEXTIWANT.html" id="SOME IDENTIFIER">SOME TEXT.</a>
</div>
</td>
这是我试图运行的代码
from bs4 import BeautifulSoup,
for td in parse.find_all(class_="alt1"):
a = str(div.get())
f.writelines(a + '\n')
答案 0 :(得分:0)
使用find_all(href=True)
for td in parse.find_all(class_="alt1"):
for href in td.find_all(href=True):
print(href.text)