我在学习爬行。
http://www.wfri.re.kr/client/PublishHp.do?command=view&list_dis_txt=PUB¤t_page=1&isu_year=all&list_unq_no=RP00000001847&search_category=&search_keyword=&pub_dt=20170203&topMenuNo=H20000&leftMenuNo=H20100
此页面上有一个tbody标记。
所以,
url = http://www.wfri.re.kr/client/PublishHp.do?command=view&list_dis_txt=PUB¤t_page=1&isu_year=all&list_unq_no=RP00000001847&search_category=&search_keyword=&pub_dt=20170203&topMenuNo=H20000&leftMenuNo=H20100
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, 'lxml')
tdTag = soup.findAll('td',class_='view_cont')
但是,结果是0
我以为JavaScript会在几秒钟后运行。
所以,我写了那个time.sleep(3)
但是,结果也是0
我应该使用硒吗?
WebDriverWait(driver, 3).until(EC.presence_of_element_located(driver.find_elements_by_tag_name('td')))
由于我的研究,写这个是对的吗?
为什么找不到标签?
***网址已被修改。