我可以打印结果,但在抓取

时间:2017-08-18 04:52:03

标签: python web-scraping beautifulsoup

我是python和scraping的初学者,所以我仍然有一些困难要刮一个简单的表格,这个表格托管在这个网站上[http://www.concursopublico.sp.gov.br/PortalConcurso/noauth/PortalDeConcursos.do?acao=concursoEncerrado]

我一直关注YouTube [https://www.youtube.com/watch?v=XQgXKtPSzUI]上的教程,但由于此网站似乎更容易抓取,因此步骤与视频中的步骤不匹配。

现在,我的代码能够打印“td”(表中的内容),但文件“concurso.csv”为空。我不确定我做错了什么。我很感激一些帮助。

由@coldspeed链接的问题重复并未澄清我的疑问 - 它也可能是其他问题。我已经搜索了很多关于我的脚本不起作用的原因。无缘无故地结束我的问题是不公平的。

@coldspeed,我甚至不询问新线或类似的东西。我的疑问与应该在CSV中的内容有关。

# my scrapper following this tutorial https://www.youtube.com/watch?v=XQgXKtPSzUI

import bs4
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = "http://www.concursopublico.sp.gov.br/PortalConcurso/noauth/PortalDeConcursos.do?acao=concursoEncerrado"
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")

td = page_soup.findAll("td")

filename = "concurso.csv"
f = open(filename, "w")

print("td")

f.close()

0 个答案:

没有答案