Question

假设我想解析页面中所有href中的文本，但我的代码似乎不起作用。在我要解析的html文档中有一些像这样的代码片段。

<td class="alt1" id="ID" title="SOMETEXT">
                <div>
                     <a href="THETEXTIWANT.html" id="SOME IDENTIFIER">SOME TEXT.</a>
                </div>
</td>

这是我试图运行的代码

from bs4 import BeautifulSoup,
    for td in parse.find_all(class_="alt1"):
        a = str(div.get())
        f.writelines(a + '\n')

Answer 1

使用find_all(href=True)

for td in parse.find_all(class_="alt1"):
    for href in td.find_all(href=True):
        print(href.text)

美丽的汤＆＃39; href＆＃39;解析

1 个答案: