我正在使用Python和Beautiful Soup解析HTML网页(不过我对其他解决方案持开放态度)。我想知道是否可以根据HTML行解析文件,即get the td tag from line3
。这可能吗?
答案 0 :(得分:1)
考虑这个例子:http://www.pythonforbeginners.com/python-on-the-web/web-scraping-with-beautifulsoup/
有逐行处理和href的匹配(你需要td)
另外考虑:soup.find_all("td", limit=3)