我必须从以下网页抓取数据:http://www.mlsa.am/?page_id=368。这是一个下拉列表,其中的选项是:地区,地区,社区,补贴类型,月和年。一旦选择了这些选项,就会显示一个表格,其中包含有关这些地方的公民获得各种补贴的信息。我当时面临的困难是,“地区”字段取决于我选择的“地区”,而“社区”取决于这两个方面。 这是我检查该网页时的样子,该信息 属于“区域”(首选)单元格:
004
我正在使用selenium和python,到目前为止,这是我的代码:
`<!--Մարզեր-->
<div class="td-pb-row">
<div class="td-pb-span2"></div>
<div class="td-pb-span5">
Մարզեր <span class="ben-required">*</span>
<select id="ref_regions_id" name="ref_regions" style="border:1px solid #0790A2;" >
<option value="0" > Ընտրել </option>
<option value="1"> ԱՐԱԳԱԾՈՏՆ</option>`
<option value="2"> ԱՐԱՐԱՏ</option>
<option value="3"> ԱՐՄԱՎԻՐ</option>
<option value="4"> ԳԵՂԱՐՔՈՒՆԻՔ</option>
<option value="5"> ԼՈՌԻ</option>
<option value="6"> ԿՈՏԱՅՔ</option>
<option value="7"> ՇԻՐԱԿ</option>
<option value="8"> ՍՅՈՒՆԻՔ</option>
<option value="9"> ՎԱՅՈՑ ՁՈՐ</option>
<option value="10"> ՏԱՎՈՒՇ</option>
<option value="11"> ԵՐԵՎԱՆ</option>`
</select>
</div>
答案 0 :(得分:0)
抱歉,我无法理解网页
您应该创建一个硒行动链来选择所需的每个[['x', 'x', 'x', 'x', 'x'], ['x', 'S', '-', '-', 'x'], ['x', 'x', '-', 'F', 'x'], ['x', 'x', 'x', 'x', 'x']]
S
,然后单击按钮。