我正在尝试使用pandas
读取html文件
我有以下代码:
state_names = pd.read_html('https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes')
但是运行此代码会给我以下错误
urllib2.URLError:urlopen错误[SSL:CERTIFICATE_VERIFY_FAILED]证书验证失败(_ssl.c:661)>
除Wikipedia之外的任何其他网站都属于这种情况 例如,运行此程序效果很好
state_names = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')
是否有解决方案来获取wikipedia
以外的html页面?
答案 0 :(得分:0)
尝试此方法。它将为您提供所有HTML数据。
import urllib2
url = 'https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes'
response = urllib2.urlopen(url=url)
html = response.read()
data = pd.read_html(html)
print data