Selenium - 获取页面中的所有iframe(甚至是嵌套的iframe)?

时间:2014-04-22 14:53:00

标签: python iframe selenium webdriver

我正在尝试使用selenium webdriver搜索我到达的所有网站的HTML。在selenium中,当我有一个iframe时,我必须切换到iframe,然后切换回主html来搜索其他iframe。

但是,对于嵌套的iframe,这可能非常复杂。我必须切换到iframe,搜索iframe,然后切换到找到一个iframe,搜索IT for iframes,然后转到另一个iframe我必须切换到主框架,然后保存我的路径以切换回我所在的位置之前等等。

不幸的是,我发现很多网页都在iframe中的iframe中有iframe(依此类推)。

这有一个简单的算法吗?或者更好的方法呢?

4 个答案:

答案 0 :(得分:5)

我无法找到具有多层嵌套框架的网站来完全测试这个概念,但我能够在只有一层嵌套框架的网站上测试它。因此,这可能需要一些调试来处理更深层的嵌套。此外,此代码假定每个iframe都有一个名称属性。

我相信沿着这些方向使用递归函数将为您解决问题,并且这里有一个示例数据结构:

def frame_search(path):
    framedict = {}
    for child_frame in browser.find_elements_by_tag_name('frame'):
        child_frame_name = child_frame.get_attribute('name')
        framedict[child_frame_name] = {'framepath' : path, 'children' : {}}
        xpath = '//frame[@name="{}"]'.format(child_frame_name)
        browser.switch_to.frame(browser.find_element_by_xpath(xpath))
        framedict[child_frame_name]['children'] = frame_search(framedict[child_frame_name]['framepath']+[child_frame_name])
        ...
        do something involving this child_frame
        ...
        browser.switch_to.default_content()
        if len(framedict[child_frame_name]['framepath'])>0:
            for parent in framedict[child_frame_name]['framepath']:
                parent_xpath = '//frame[@name="{}"]'.format(parent)
                browser.switch_to.frame(browser.find_element_by_xpath(parent_xpath))
    return framedict

您可以致电:frametree = iframe_search([])将其启动,framedict最终会看起来像这样:

frametree = 
{'child1' : 'framepath' : [], 'children' : {'child1.1' : 'framepath' : ['child1'], 'children' : {...etc}}, 
 'child2' : 'framepath' : [], 'children' : {'child2.1' : 'framepath' : ['child2'], 'children' : {...etc}}}

注意:我写这篇文章的原因是使用框架的属性来识别它们而不是仅仅使用find_elements方法的结果是我在某些情况下发现Selenium会在之后抛出过时的数据异常页面已经打开太久了,这些响应不再有用。显然,框架的属性不会改变,因此使用xpath会更稳定一些。希望这会有所帮助。

答案 1 :(得分:1)

def find_all_iframes(driver):
    iframes = driver.find_elements_by_xpath('//iframe')
    for index, iframe in enumerate(iframes):
        # Your sweet business logic applied to iframe goes here.
        driver.switch_to.frame(index)
        find_all_iframes(driver=driver)
        driver.switch_to.parent_frame()

ID,名称或关于属性的任何其他假设均不可靠。虽然依靠iframe索引似乎非常可靠。

答案 2 :(得分:0)

您可以通过记住要定位的简单代码行将一个iFrame嵌套到另一个iFrame中,然后使用以下COMPLETE代码中的as将光标重新定位到屏幕的同一区域,记住始终放置更大的iFrame FIRST,然后定义SMALLER iFrame SECOND的位置,如下面的完整示例所示:---

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

<html>
<head>
<title>Daneiella Oddie, Austrailian Ballet Dancer, dancing to Bach-Gounod's Ave Maria</title>
</head>
<body bgcolor="#ffffcc">

<DIV style="position: absolute; top:0px; left:0px; width:0px; height:0px"></div>
<DIV style="position: absolute; top:10px; left:200px; width:900px; height:500px">

<iframe width="824" height="472" src="http://majordomoers.me/Videos/DanielaOddiDancingToBack_GounodsAveMaria.mp4" frameborder="0" allowfullscreen></iframe>
</div>

<DIV style="position: absolute; top:0px; left:0px; width:0px; height:0px"></div>
<DIV style="position: absolute; top:10px; left:0px; width:50px; height:50px">

<iframe src="http://majordomoers.me/Videos/LauraUllrichSingingBach_GounodsAveMaria.mp4" frameborder="0" allowfullscreen></iframe>

</div>

<DIV style="position: absolute; top:0px; left:0px; width:0px; height:0px"></div>
<DIV style="position: absolute; top:470px; left:10px; width:1050px; height:30px">

<br><font face="Comic Sans MS" size="3" color="red">  
<li><b>Both Videos will START automatically...but the one with the audio will preceed the dancing by about 17 seconds.  You should keep
<li>both videos at the same size as presented here.  In all, just lean back and let it all unfold before you, each in its own time.</li></font>
</div>
<br>

</body>
</html>

答案 3 :(得分:0)

您可以使用下面的代码来获取嵌套的框架层次结构...根据您的DOM结构更改getAttribute。

static Stack<String> stackOfFrames = new Stack<>();

....
....

public static void getListOfFrames(WebDriver driver) {   
    List<WebElement> iframes = wd.findElements(By.xpath("//iframe|//frame"));
    int numOfFrames = iframes.size();
    for(int i=0; i<numOfFrames;i++) {
        stackOfFrames.push(iframes.get(i).getAttribute("id"));
        System.out.println("Current Stack => " + stackOfFrames);
        driver.switchTo().frame(i);
        getListOfFrames(driver);
        driver.switchTo().parentFrame();
        stackOfFrames.pop();
        count++;
    }   
}