我想抓取的网站有多个动态加载的网页,我想模拟点击(不像硒那样打开浏览器),所以我使用的是Ghost.py。
这是简单的程序
from ghost import Ghost
import time
ghost = Ghost(wait_timeout=50)
page, extra_resources = ghost.open("http://www.samsung.com/in/consumer/mobile-phone/mobile-phone/viewall")
#ghost.wait_page_loaded()
n=2;
#links=ghost.evaluate("""
# alist=document.getElementsById('txtViewAll');
# alist.click;
# """)
#print type(ghost.click("input#txtViewAll"))
page1, resources = ghost.evaluate("document.getElementById('txtViewAll').click();", expect_loading=True)
time.sleep(20)
print page1
BUT
输出为无。
有人可以帮助我解决该计划的错误。
为什么它不起作用?