以下是拉斯维加斯金沙会SEC页面的链接: http://www.sec.gov/cgi-bin/viewer?action=view&cik=1300514&accession_number=0001193125-13-431316&xbrl_type=v
我正在尝试阅读excel文件,季度报告 - 通过链接标识如下。这个链接工作正常,是一个xlsx: http://www.sec.gov/Archives/edgar/data/1300514/000119312513431316/Financial_Report.xlsx
使用pandas可以像这样读取文件
link='http://www.sec.gov/Archives/edgar/data/1300514/000119312513327904/Financial_Report.xls'
socket = urllib2.urlopen(link)
xd = pd.ExcelFile(socket)
现在这在xlsx上运行得很好,但不适用于上面列出的xls。
如果在excel中打开xls,则会收到错误消息: 此文档是单个文件网页,也称为Web存档文件。如果您看到此消息,则您的浏览器或编辑器不支持Web存档文件。请下载支持Web Archive的浏览器,例如Microsoft Internet Explorer。
我正在使用Mac OSX - 我是否需要在浏览器中更改用户代理?我很抱歉提出一个开放式问题 - 但有人能想出如何使用Pandas来解析该文件吗?或绕过该错误?