根据初始数字列表从多个页面中删除数字

时间:2015-12-14 08:39:56

标签: python web-scraping beautifulsoup

说我有一个数字列表(数百,例如3,11,34到200)

我想为每个号码自动执行以下过程:

  1. 转到网页,在搜索框中输入数字并按回车键,搜索框的以下标记会返回到所需的页面,如:

    input id="myid" type="text" name="yadda[goTo][number]" value="3"
    
  2. 所以value =" 3",3是我初始列表中的数字。

    1. 然后在该页面上,提取以下标记(只是第一个,可能有多个类似的标记):

      meta content="website.com/yadda1/yadda2/dfd_I1123_35362542_1d8sw31124a.jpg" />
      
    2. 我只需要此标记中的35362542号码,然后要有一个与初始号码匹配的表格,例如3,用这个号码。

    3. 重复初始列表中的所有数字

    4. 最好的方法是什么?美丽的汤?

0 个答案:

没有答案