我需要使用pandas从excel文件中逐年提取数据,excel文件采用以下格式:
File-a
2000 2001 2002
01/01 0.50 6.7 4.66
01/02 1.55 5.5 5.8
01/03 2.36 4.4 7.8
我正在做这样的事情:
xl = pd.ExcelFile('file_path')
sheets= xl.sheet_names
table2 = xl.parse(sheets[0], header=0)
df_append=table2.ix[1:,1:2]
arr=df_append.values.tolist()
arr=np.squeeze(np.asarray(arr))
price_arr=np.array2string(arr,separator=', ')
print price_arr
我需要在数组中转换列2000,2001等中的数据并使用列名动态提取它们,而不是像我上面所做的列索引那样。我试过这样做,但它没有用:
df_append=table2.ix[1:,'2000']
您能否建议我如何根据特定年份列提取数据?此外,年份列从第二行开始,而不是在标题列中。感谢。