我正在尝试使用selenium webdriver搜索我到达的所有网站的HTML。在selenium中,当我有一个iframe时,我必须切换到iframe,然后切换回主html来搜索其他iframe。
但是,对于嵌套的iframe,这可能非常复杂。我必须切换到iframe,搜索iframe,然后切换到找到一个iframe,搜索IT for iframes,然后转到另一个iframe我必须切换到主框架,然后保存我的路径以切换回我所在的位置之前等等。
不幸的是,我发现很多网页都在iframe中的iframe中有iframe(依此类推)。
这有一个简单的算法吗?或者更好的方法呢?
答案 0 :(得分:5)
我无法找到具有多层嵌套框架的网站来完全测试这个概念,但我能够在只有一层嵌套框架的网站上测试它。因此,这可能需要一些调试来处理更深层的嵌套。此外,此代码假定每个iframe都有一个名称属性。
我相信沿着这些方向使用递归函数将为您解决问题,并且这里有一个示例数据结构:
def frame_search(path):
framedict = {}
for child_frame in browser.find_elements_by_tag_name('frame'):
child_frame_name = child_frame.get_attribute('name')
framedict[child_frame_name] = {'framepath' : path, 'children' : {}}
xpath = '//frame[@name="{}"]'.format(child_frame_name)
browser.switch_to.frame(browser.find_element_by_xpath(xpath))
framedict[child_frame_name]['children'] = frame_search(framedict[child_frame_name]['framepath']+[child_frame_name])
...
do something involving this child_frame
...
browser.switch_to.default_content()
if len(framedict[child_frame_name]['framepath'])>0:
for parent in framedict[child_frame_name]['framepath']:
parent_xpath = '//frame[@name="{}"]'.format(parent)
browser.switch_to.frame(browser.find_element_by_xpath(parent_xpath))
return framedict
您可以致电:frametree = iframe_search([])
将其启动,framedict
最终会看起来像这样:
frametree =
{'child1' : 'framepath' : [], 'children' : {'child1.1' : 'framepath' : ['child1'], 'children' : {...etc}},
'child2' : 'framepath' : [], 'children' : {'child2.1' : 'framepath' : ['child2'], 'children' : {...etc}}}
注意:我写这篇文章的原因是使用框架的属性来识别它们而不是仅仅使用find_elements方法的结果是我在某些情况下发现Selenium会在之后抛出过时的数据异常页面已经打开太久了,这些响应不再有用。显然,框架的属性不会改变,因此使用xpath会更稳定一些。希望这会有所帮助。
答案 1 :(得分:1)
def find_all_iframes(driver):
iframes = driver.find_elements_by_xpath('//iframe')
for index, iframe in enumerate(iframes):
# Your sweet business logic applied to iframe goes here.
driver.switch_to.frame(index)
find_all_iframes(driver=driver)
driver.switch_to.parent_frame()
ID,名称或关于属性的任何其他假设均不可靠。虽然依靠iframe索引似乎非常可靠。
答案 2 :(得分:0)
您可以通过记住要定位的简单代码行将一个iFrame嵌套到另一个iFrame中,然后使用以下COMPLETE代码中的as将光标重新定位到屏幕的同一区域,记住始终放置更大的iFrame FIRST,然后定义SMALLER iFrame SECOND的位置,如下面的完整示例所示:---
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<title>Daneiella Oddie, Austrailian Ballet Dancer, dancing to Bach-Gounod's Ave Maria</title>
</head>
<body bgcolor="#ffffcc">
<DIV style="position: absolute; top:0px; left:0px; width:0px; height:0px"></div>
<DIV style="position: absolute; top:10px; left:200px; width:900px; height:500px">
<iframe width="824" height="472" src="http://majordomoers.me/Videos/DanielaOddiDancingToBack_GounodsAveMaria.mp4" frameborder="0" allowfullscreen></iframe>
</div>
<DIV style="position: absolute; top:0px; left:0px; width:0px; height:0px"></div>
<DIV style="position: absolute; top:10px; left:0px; width:50px; height:50px">
<iframe src="http://majordomoers.me/Videos/LauraUllrichSingingBach_GounodsAveMaria.mp4" frameborder="0" allowfullscreen></iframe>
</div>
<DIV style="position: absolute; top:0px; left:0px; width:0px; height:0px"></div>
<DIV style="position: absolute; top:470px; left:10px; width:1050px; height:30px">
<br><font face="Comic Sans MS" size="3" color="red">
<li><b>Both Videos will START automatically...but the one with the audio will preceed the dancing by about 17 seconds. You should keep
<li>both videos at the same size as presented here. In all, just lean back and let it all unfold before you, each in its own time.</li></font>
</div>
<br>
</body>
</html>
答案 3 :(得分:0)
您可以使用下面的代码来获取嵌套的框架层次结构...根据您的DOM结构更改getAttribute。
static Stack<String> stackOfFrames = new Stack<>();
....
....
public static void getListOfFrames(WebDriver driver) {
List<WebElement> iframes = wd.findElements(By.xpath("//iframe|//frame"));
int numOfFrames = iframes.size();
for(int i=0; i<numOfFrames;i++) {
stackOfFrames.push(iframes.get(i).getAttribute("id"));
System.out.println("Current Stack => " + stackOfFrames);
driver.switchTo().frame(i);
getListOfFrames(driver);
driver.switchTo().parentFrame();
stackOfFrames.pop();
count++;
}
}