我正在尝试编写一个登录网站的特定脚本。这个特定的网站包含一个Javascript表单,所以我通过使用“机械化”几乎没有运气。
我很好奇是否存在其他我可能不知道的解决方案,这对我的情况有帮助。如果之前已经在这里询问过这个特定的问题或一些相关的变体,请原谅,我希望链接到这个特定的查询。否则,处理这个问题的常用技巧/方法是什么?
感谢。
答案 0 :(得分:1)
我最近一直在使用PhantomJS进行此类工作 - 它是一个命令行工具,允许您在浏览器环境中运行Javascript(基于Webkit)。这允许您进行需要启用Javascript的界面的抓取和在线交互。有一个Python-based implementation here与C ++版本的API完全兼容,或者您可以通过subprocess
在Python中运行任一版本。
根据你想要做的事情,另一个好的选择可能是使用Selenium,它在Python中有客户端驱动程序实现 - 它用于集成测试,但可以做很多自动化,只要您可以运行基于Java的Selenium Server,并在开放式浏览器中实现自动化,而不是作为后台进程。