标签: python html headless-browser ghost.py
我正在尝试创建一个执行多个搜索并下载结果的自动化系统。我需要先对网站进行身份验证,直接进入搜索页面,设置搜索参数,制作html req,其中包含post发送的一些值,获取html响应以解析下载和下载的内容。你能帮助我并将我的一些样本重定向到如何做这样的事情吗?什么是最好的包使用?
最佳
答案 0 :(得分:0)
当我需要为一些关键信息解析一堆HTML时,我很幸运能够使用Python,我总是先找到BeautifulSoup。
https://www.crummy.com/software/BeautifulSoup/