我有各种类别的时间序列数据矩阵,例如
>>> x
a b c
2019-06-01 2 5 2
2019-06-02 5 3 8
2019-06-03 2 7 9
我还有另一个具有相同索引的系列,告诉我应该为给定日期选择哪个类别,例如
>>> y
2019-06-01 a
2019-06-02 b
2019-06-03 c
dtype: object
我想输出一个向量,其中包含来自x的元素,并以y给出列名,因此在此简化示例中,我想选择x的对角元素。
当前我正在循环执行此操作
output = pd.Series(index=x.index)
for row in x.itertuples():
output.at[row.Index] = x.at[row.Index, y.at[row.Index]]
有什么方法可以向量化它以使其更快?