我的目的是遍历页面,点击每个页面,然后从中获取一些信息。我使用selenium for Python。我的问题是我找不到任何链接/ href,我应该点击HTML中的页面。
这就是HTML的样子。我找到了pageNum的列表,但是当我点击它们时,我收到一个错误。当我更仔细地查看HTML时,我发现我没有并在那里链接。那我该怎么办?
如您所见,下面我添加了一些HTML,“表单方法”。我也在HTML中找到了它。也许它会有所帮助。当我比较页面的不同href时,它们由这个模块组成。
<a class="pageNum" rel="1" >1</a>
<a class="pageNum" rel="2" >2</a>
<a class="pageNum" rel="3" >3</a>
<a class="pageNum" rel="4" >4</a>
<a class="pageNum" rel="5" >5</a>
<a class="pageNum" rel="6" >6</a>
<a class="pageNum" rel="7" >7</a>
<a class="pageNum" rel="8" >8</a>
<a class="pageNum" rel="9" >9</a>
<a class="pageNum" rel="10" >10</a>
<a class="pageNum" rel="11" >11</a>
<a class="pageNum" rel="12" >12</a>
<a class="pageNum" rel="13" >13</a>
<a class="pageNum" rel="14" >14</a>
<a class="pageNum" rel="15" >15</a>
<form method="get" id="searchParams" action="https://www.ida.org.il/">
<input type="hidden" name="pageType" value="19"/>
<input type="hidden" name="langId" value="1"/>
<input type="hidden" name="currPage" value="20"/>
<input type="hidden" name="paramIds" value=",321,322,354,355,320"/>
<input type="hidden" name="scope" value=""/>
<input type="hidden" name="parameterSearch" value=""/>
</form>
下面你可以看到我想要迭代的列。
答案 0 :(得分:0)
即使没有href
属性,您仍然可以点击页码并重定向。使用rel
属性
page_number = 2
driver.find_element_by_css_selector('[rel="' + page_number + '"]').click()