我需要html页面的内容,但如果html页面包含iframe元素,我也需要iframe内容。 (在Python中) 是否可以使用python函数加载所有内容?
答案 0 :(得分:3)
尝试使用BeautifulSoup,supports iframes out of the box。
代码段(full code here):
import re
from BeautifulSoup import BeautifulSoup, Comment
...
for iframe in mosoup("iframe"):
mosoup.iframe.extract()
UPDATE:链接到当前代码位置(现在位于github中)。