获取所有嵌入/对象元素,包括iframe内的那些元素(js / python)

时间:2012-11-15 22:57:40

标签: javascript python html getelementsbytagname

尝试在给定页面上查找Flash对象的所有实例,包括iframe元素内的那些实例。

除了

之外,javascript中是否还有一种方法可以解释iframe中的内容
document.getElementsByTagName("embed")
document.getElementsByTagName("objects")

我也在使用python并且可以获取页面的完整来源,是否可以为此提供工作途径?

1 个答案:

答案 0 :(得分:1)

正如Sibi建议的那样,根据你的目标,使用jQuery可能最容易。但是,如果您可以访问Python,则可以使用BeautifulSoup。如果您希望以任何方式获取这些链接背后的数据,这将特别有用。

如果这是您想要追求的路线,您可以执行以下操作:

from bs4 import BeautifulSoup
soup = BeautifulSoup(page_source)

objects = []
objects.extend(soup.find_all('object'))
objects.extend(soup.find_all('embed'))

如果错过了iframe中的对象,你可以添加:

iframes = soup.find_all('iframe')
for iframe in iframes:
    objects.extend(iframe.find_all('object'))
    objects.extend(iframe.find_all('embed'))