我希望收集来自this Excel文件中倒数第二个工作表的所有数据以及上一个工作表中的所有数据来自"成熟年份" 5.5以上。我下面的代码目前只从最后一本工作簿中获取数据,我想知道必要的修改是什么。
import urllib2
import pandas as pd
import os
import xlrd
url = 'http://www.bankofengland.co.uk/statistics/Documents/yieldcurve/uknom05_mdaily.xls'
socket = urllib2.urlopen(url)
xd = pd.ExcelFile(socket)
df = xd.parse(xd.sheet_names[-1], header=None)
print df
我正在考虑使用glob
,但我还没有看到使用在线Excel文件的任何应用程序。
编辑:我认为以下内容允许我将两个数据工作表合并为一个Dataframe。但是,如果有更好的答案,请随时展示。
import urllib2
import pandas as pd
import os
import xlrd
url = 'http://www.bankofengland.co.uk/statistics/Documents/yieldcurve/uknom05_mdaily.xls'
socket = urllib2.urlopen(url)
xd = pd.ExcelFile(socket)
df1 = xd.parse(xd.sheet_names[-1], header=None)
df2 = xd.parse(xd.sheet_names[-2], header=None)
bigdata = df1.append(df2,ignore_index = True)
print bigdata