美丽的汤' href'解析

时间:2017-11-24 12:14:31

标签: python beautifulsoup html-parsing

假设我想解析页面中所有href中的文本,但我的代码似乎不起作用。 在我要解析的html文档中有一些像这样的代码片段。

<td class="alt1" id="ID" title="SOMETEXT">
                <div>
                     <a href="THETEXTIWANT.html" id="SOME IDENTIFIER">SOME TEXT.</a>
                </div>
</td>

这是我试图运行的代码

from bs4 import BeautifulSoup,
    for td in parse.find_all(class_="alt1"):
        a = str(div.get())
        f.writelines(a + '\n')

1 个答案:

答案 0 :(得分:0)

使用find_all(href=True)

for td in parse.find_all(class_="alt1"):
    for href in td.find_all(href=True):
        print(href.text)