在python中使用beautifulsoup和selenium来爬行iframe

时间:2015-08-17 21:57:32

标签: python selenium iframe beautifulsoup web-crawler

我会抓取它有iframe的网站。

http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20150515001896。它在Chrome浏览器中有2个选项。("查看页面源""查看框架源"或者。)

但是使用Beautiful Soup访问网址,urllib2或selenium只给了我没有iframe的网页来源

我如何访问可在Chrome上看到的iframe源?

以下代码用于访问该网站的页面来源。

from selenium import webdriver
import urllib2
from bs4 import BeautifulSoup

url = "http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20150515001896"
f = urllib2.urlopen(url)

#or

browser = webdriver.Chrome()
browser.get(url)
html_source = browser.page_source

#show only the page sources