构建网络抓取循环以提取药物信息

时间:2019-11-23 18:16:42

标签: python loops web-scraping

我正在尝试从以下网站提取毒品信息:https://www.medindia.net/doctors/drug_information/abacavir.htm

到目前为止,我已经能够提取一个网页上的药物信息(阿巴卡韦)。现在,我需要有关如何构建一个循环以从同一网站(www.medindia.net)上其他网页提取其他药物所需的所有药物信息的建议。代码如下。

onMouseWheel(evt) {
event = evt.target.tagName;
while(event != 'MAIN')
  event = evt.target.parentNode.tagName;
}

1 个答案:

答案 0 :(得分:0)

创建一个函数!

def extract_drug_info(url):
    """ Extracts drug information of a given medindia.com website. """

    # ... rest of the code you posted above here ...
    return drug_stuff

然后遍历一些URL:

urls = ["https://www.medindia.net/doctors/drug_information/abacavir.htm", "..."]
for url in urls:
    print(extract_drug_info(url))