逐行解析HTML

时间:2013-10-16 00:50:05

标签: python html parsing beautifulsoup

我正在使用Python和Beautiful Soup解析HTML网页(不过我对其他解决方案持开放态度)。我想知道是否可以根据HTML行解析文件,即get the td tag from line3。这可能吗?

1 个答案:

答案 0 :(得分:1)

考虑这个例子:http://www.pythonforbeginners.com/python-on-the-web/web-scraping-with-beautifulsoup/有逐行处理和href的匹配(你需要td)

另外考虑:soup.find_all("td", limit=3)