我正在尝试编写一个访问网页(http://www.yeastgenome.org/locus/S000001142/overview)并下载(DNA序列,fasta)文件的Python脚本。只需点击一个下拉菜单,该文件就会自动下载。
这是下拉菜单:
下载(.fsa)
并且其中一个选项例如是:
基因组DNA +/- 1kb
有人可以指出我正确的方向,怎么做?
Selenium模块?
非常感谢!
答案 0 :(得分:1)
您基本上想要导航到该页面,单击下拉列表将其打开,然后单击所需的选项。你将需要一些等待...一个等待页面底部加载并显示下拉列表和另一个短暂停顿等待下拉列表打开。
from selenium.webdriver.support import expected_conditions as EC
driver.get("http://www.yeastgenome.org/locus/S000001142/overview")
wait = WebDriverWait(driver, 4)
wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,"a.dropdown"))).click()
option = "Protein" // change to the desired option in the dropdown... must be EXACT text
wait.until(EC.element_to_be_clickable((By.XPATH,"//ul[contains(@class,'open')]/li/a[text()='" + option + "']"))).click()