使用Python

时间:2018-05-11 14:50:41

标签: python html selenium web-scraping

我在html上有这个简单的页面:

<html>
  <body>
    <p>Javascript (dynamic data) test:</p>
    <p class='jstest' id='yesnojs'>Hello</p>

    <button onclick="myFunction()">Try it</button>

    <script>
      function myFunction() {
        document.getElementById('yesnojs').innerHTML = 'GoodBye';
      }
    </script>
  </body>
</html>

我想现在废弃这个页面使用Python来获取id“yesnojs”是“GoodBye”,我的意思是,当用户点击按钮时。我一直在尝试一些教程,但我总是得到“你好”,如果我有点击并且我在“GoodBye”页面上查看它并不在意。

我希望你的帮助,谢谢你。

PD: 这是我在Python上的代码,用于尝试抓取页面:

from selenium import webdriver

chrome_path=
"C:\\Users\\Antonio\\Downloads\\chromedriver_win32\\chromedriver.exe"

driver = webdriver.Chrome(chrome_path)

driver.get("http://localhost/templates/scraping.html")
review = driver.find_elements_by_class_name("jstest")
for post in review:
    print(post.text)

1 个答案:

答案 0 :(得分:0)

Selenium不会附加到您现有的开放网页上。它会打开一个新的网页。如果您正在设计单元测试,则必须使用Selenium模拟点击。

或者,您是否正在考虑制作一个浏览器扩展程序,在此事件发生时进行抓取,Selenium不是此工具。