Question

我正在尝试使用pandas读取html文件

我有以下代码：

state_names = pd.read_html('https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes')

但是运行此代码会给我以下错误

urllib2.URLError：urlopen错误[SSL：CERTIFICATE_VERIFY_FAILED]证书验证失败（_ssl.c：661）>

除Wikipedia之外的任何其他网站都属于这种情况例如，运行此程序效果很好

state_names = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')

是否有解决方案来获取wikipedia以外的html页面？

Answer 1

尝试此方法。它将为您提供所有HTML数据。

import urllib2  

url = 'https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes'
response = urllib2.urlopen(url=url) 
html = response.read()
data = pd.read_html(html) 
print data

urllib2.URLError尝试阅读html时

1 个答案: