我希望重新格式化来自多个Excel文件的股市数据。
标题为“ ticker”的列具有唯一的文本值。我想让此列中所有可能的唯一值充当其各自列中的标题。从那里,我想将“权重”列中的相应值与每列下方的行进行匹配,并以“日期”列为索引。
我曾尝试在excel中使用移动索引匹配,但是它变得过于复杂。这是我的代码:
import os
import xlrd
import pandas as pd
import numpy as np
path = r"PATH\dummyfolder"
os.getcwd()
files = os.listdir(path)
df = pd.DataFrame()
for f in files:
data = pd.read_excel(f, header = None, usecols="A,E,L")
df = df.append(data)
df = df.rename(columns={ 0: "ticker", 4: "weight", 11:"date"})
print(df)
以下是当前输出:
ticker weight date
0 APU 6.66665 2015-05-01
1 BPL 6.66667 2015-05-02
2 CQP 6.66662 2015-05-03
我希望它看起来像这样:
APU BPL CQP date
0 6.66665 2015-05-01
1 6.66667 2015-05-02
2 6.66662 2015-05-03