Question

我会抓取它有iframe的网站。

见http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20150515001896。它在Chrome浏览器中有2个选项。（＆＃34;查看页面源＆＃34;＆＃34;查看框架源＆＃34;或者。）

但是使用Beautiful Soup访问网址，urllib2或selenium只给了我没有iframe的网页来源

我如何访问可在Chrome上看到的iframe源？

以下代码用于访问该网站的页面来源。

from selenium import webdriver
import urllib2
from bs4 import BeautifulSoup

url = "http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20150515001896"
f = urllib2.urlopen(url)

#or

browser = webdriver.Chrome()
browser.get(url)
html_source = browser.page_source

#show only the page sources

Answer 1

只需访问以下网址即可解决。

http://dart.fss.or.kr/report/viewer.do?rcpNo=20150515001896&dcmNo=4671059&eleId=17&offset=1015699&length=132786&dtd=dart3.xsd

在python中使用beautifulsoup和selenium来爬行iframe

1 个答案: