urllib2.URLError尝试阅读html时

时间:2019-03-13 12:07:30

标签: python pandas

我正在尝试使用pandas读取html文件

我有以下代码:

state_names = pd.read_html('https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes')

但是运行此代码会给我以下错误

  

urllib2.URLError:urlopen错误[SSL:CERTIFICATE_VERIFY_FAILED]证书验证失败(_ssl.c:661)>

除Wikipedia之外的任何其他网站都属于这种情况 例如,运行此程序效果很好

state_names = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')

是否有解决方案来获取wikipedia以外的html页面?

1 个答案:

答案 0 :(得分:0)

尝试此方法。它将为您提供所有HTML数据。

import urllib2  

url = 'https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes'
response = urllib2.urlopen(url=url) 
html = response.read()
data = pd.read_html(html) 
print data