我正在与python3挣扎。我自学了基础知识。现在我正在学习webdriver和bs4。 FUN!
我想抓一页的页面。在其他情况下,我制作了一个工作脚本。但现在我正在一个让我头疼的页面上!
我认为问题是内容是动态加载的。 (它不在页面源上)
这是页面:https://www.dnls.nl/locatie/diergaarde-blijdorp-rotterdam
本文中有一个元素:Toon telefoonnummer。我可以点击它:
<div class="show_onclick">
<div class="text-center telephone-field"><a class="set-align" :href="'tel:'+project.contact_phone">{{project.contact_phone}}</a></div>
<div class="text-center">{{project.contact_textline}}</div>
</div>
电话号码是可见的,但仅限于我的眼睛!我试着用xpath和css抓住这个数字几个小时,但是我无法抓住它!
在pagesource中我看到了:
from selenium import webdriver
try:
#telefoonnummer
driver.find_element_by_link_text("Toon telefoonnummer").click() #This works
driver.implicitly_wait(5)
telefoonnummer = driver.find_element_by_xpath(".//*[@id='main-inner']/div[1]/div[1]/div/div[2]/ul[1]/li[3]/div/div[1]/a").text
print(telefoonnummer)
except:
print("")
这是我的最后一段代码:
"contact_name":"Blijdorp Happenings","contact_phone":"010 4431415","contact_email":"sales@diergaardeblijdorp.nl"
有没有办法刮掉这种内容?
更新:我在页面源头部的javascript中找到了数据。它是一个庞大的JavaScript,它包含:
NET::ERR_CERT_COMMON_NAME_INVALID
我的目标是什么:我希望找到电话号码,复制到电话号码并在电话会议中保护它#&#39;
亲切的问候!