应用错误收集

使用python无头浏览器获取html响应

时间：2017-07-26 15:12:14

标签： python html headless-browser ghost.py

我正在尝试创建一个执行多个搜索并下载结果的自动化系统。我需要先对网站进行身份验证，直接进入搜索页面，设置搜索参数，制作html req，其中包含post发送的一些值，获取html响应以解析下载和下载的内容。你能帮助我并将我的一些样本重定向到如何做这样的事情吗？什么是最好的包使用？

最佳

1 个答案:

答案 0 :(得分：0)

当我需要为一些关键信息解析一堆HTML时，我很幸运能够使用Python，我总是先找到BeautifulSoup。

https://www.crummy.com/software/BeautifulSoup/