我是python和scraping的初学者,所以我仍然有一些困难要刮一个简单的表格,这个表格托管在这个网站上[http://www.concursopublico.sp.gov.br/PortalConcurso/noauth/PortalDeConcursos.do?acao=concursoEncerrado]。
我一直关注YouTube [https://www.youtube.com/watch?v=XQgXKtPSzUI]上的教程,但由于此网站似乎更容易抓取,因此步骤与视频中的步骤不匹配。
现在,我的代码能够打印“td”(表中的内容),但文件“concurso.csv”为空。我不确定我做错了什么。我很感激一些帮助。
由@coldspeed链接的问题重复并未澄清我的疑问 - 它也可能是其他问题。我已经搜索了很多关于我的脚本不起作用的原因。无缘无故地结束我的问题是不公平的。
# my scrapper following this tutorial https://www.youtube.com/watch?v=XQgXKtPSzUI
import bs4
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url = "http://www.concursopublico.sp.gov.br/PortalConcurso/noauth/PortalDeConcursos.do?acao=concursoEncerrado"
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")
td = page_soup.findAll("td")
filename = "concurso.csv"
f = open(filename, "w")
print("td")
f.close()