Question

我希望收集来自this Excel文件中倒数第二个工作表的所有数据以及上一个工作表中的所有数据来自＆＃34;成熟年份＆＃34; 5.5以上。我的代码如下。我目前只是将两张纸的所有数据合并在一起。我不知道如何只提取与＆＃34;成熟年＆＃34;相关的数据。在最后一个工作表中的5.5。

import urllib2
import pandas as pd
import os
import xlrd 

url = 'http://www.bankofengland.co.uk/statistics/Documents/yieldcurve/uknom05_mdaily.xls'
socket = urllib2.urlopen(url)

xd = pd.ExcelFile(socket)
df1 = xd.parse(xd.sheet_names[-1], header=None)
df2 = xd.parse(xd.sheet_names[-2], header=None)

bigdata = df1.append(df2,ignore_index = True)
print bigdata

Answer 1

您可以添加：df1 = df1.loc[:, df1.loc[3, :] >= 5.5]，其中df1.loc[3, :]假定成熟度始终位于工作表的第4行。

使用Excel文件仅从URL中提取特定数据集

1 个答案: