我正在尝试实现一个点击事件,以从该页面获取每个条目的详细信息:https://www.mrlodge.de/wohnungen/
链接到“详细信息”的按钮的HTML标记如下所示:
<li class="action mrl-list__item details-bt">
<button>
<span class="icon icon-arrow-right">
::before
</span>
"Details"
</button>
</li>
我在LUA和Splash上有一些经验,但是不知道如何解决此问题,因为html标记中没有给出实际的href链接。我已经阅读了有关Splash方法mouseclick()的信息,该方法需要像素方向。但是,我正在使用Splash寻找更通用的解决方案。
请帮助
答案 0 :(得分:1)
此页面未使用javascript。尝试禁用javascript,该页面仍然有效。该页面改为使用表单。
>>> fetch('https://www.mrlodge.de/wohnungen/')
2019-07-10 14:56:41 [scrapy.core.engine] INFO: Spider opened
>>> response.xpath('//form/input[@name="name_url"]/@value').extract()
[u'/wohnen-auf-zeit/2-zimmer-wohnung-muenchen-maxvorstadt-11609/', u'/wohnen-auf-zeit/4-zimmer-haus-muenchen-fuerstenried-10756/', u'/wohnen-auf-zeit/3-zimmer-wohnung-muenchen-lerchenau-11653/', u'/wohnen-auf-zeit/2-zimmer-wohnung-muenchen-glockenbachviertel-4180/', u'/wohnen-auf-zeit/2-zimmer-wohnung-muenchen-berg-am-laim-11625/']