迭代html中的页面

时间:2017-09-25 04:42:15

标签: python selenium selenium-webdriver

我的目的是遍历页面,点击每个页面,然后从中获取一些信息。我使用selenium for Python。我的问题是我找不到任何链接/ href,我应该点击HTML中的页面。

这就是HTML的样子。我找到了pageNum的列表,但是当我点击它们时,我收到一个错误。当我更仔细地查看HTML时,我发现我没有并在那里链接。那我该怎么办?

如您所见,下面我添加了一些HTML,“表单方法”。我也在HTML中找到了它。也许它会有所帮助。当我比较页面的不同href时,它们由这个模块组成。

<a class="pageNum" rel="1" >1</a>
<a class="pageNum" rel="2" >2</a>
<a class="pageNum" rel="3" >3</a>
<a class="pageNum" rel="4" >4</a>
<a class="pageNum" rel="5" >5</a>
<a class="pageNum" rel="6" >6</a>
<a class="pageNum" rel="7" >7</a>
<a class="pageNum" rel="8" >8</a>
<a class="pageNum" rel="9" >9</a>
<a class="pageNum" rel="10" >10</a>
<a class="pageNum" rel="11" >11</a>
<a class="pageNum" rel="12" >12</a>
<a class="pageNum" rel="13" >13</a>
<a class="pageNum" rel="14" >14</a>
<a class="pageNum" rel="15" >15</a>   


<form method="get" id="searchParams" action="https://www.ida.org.il/">
    <input type="hidden" name="pageType" value="19"/>
    <input type="hidden" name="langId" value="1"/>
    <input type="hidden" name="currPage" value="20"/>
    <input type="hidden" name="paramIds" value=",321,322,354,355,320"/>
    <input type="hidden" name="scope" value=""/>
    <input type="hidden" name="parameterSearch" value=""/>
</form>

这是网站:https://www.ida.org.il/?pageType=19&langId=1&paramIds=%2Con_321%2Con_322%2Con_354%2Con_355%2Con_320&scope=&parameterSearch=

下面你可以看到我想要迭代的列。

1 个答案:

答案 0 :(得分:0)

即使没有href属性,您仍然可以点击页码并重定向。使用rel属性

page_number = 2
driver.find_element_by_css_selector('[rel="' + page_number + '"]').click()