我试图用Windmill编写一个简单的脚本来打开一个页面(有javascript),然后下载整个html。我的代码是:
from windmill.authoring import setup_module, WindmillTestClient
from windmill.conf import global_settings
import sys
global_settings.START_FIREFOX = True
setup_module(sys.modules[__name__])
def my_func():
url = "a certain url"
client = WindmillTestClient(__name__)
client.open(url=cur_url)
html = client.commands.getPageText()
最后一行,getPageText()似乎挂了。什么都没发生,永远不会回来。
另外,风车每次都需要打开整个GUI吗?如果是的话,python中是否有一个函数在我完成时关闭它(任何实际文档的链接都会有帮助;我发现的只是一些例子)?
编辑:仅使用Selenium解决了问题,花了大约15分钟而不是3小时试图让Windmill工作。 我的一位同事想出了一个替代解决方案,即实际观察进入浏览器的网络流量并刮取GET请求。不完全确定他是怎么做到的。