我面临一个无法解决的问题。
我也觉得很难解释我想要做的事情,所以希望一个小例子会有所帮助
我有df1
:
Id product_1 product_2
Date
1 0.1855672 0.8855672
2 0.1356667 0.0356667
3 1.1336686 1.7336686
4 0.9566671 0.6566671
我有 df2
这样的:
product_1 Month
Date
2018-03-30 11.0 3
2018-04-30 18.0 4
2019-01-29 14.0 1
2019-02-28 22.0 2
而我试图在 df2
中实现的目标:
product_1 Month seasonal_index
Date
2018-03-30 11.0 3 1.1336686
2018-04-30 18.0 4 0.9566671
2019-01-29 14.0 1 0.1855672
2019-02-28 22.0 2 0.1356667
所以我尝试将 df2
中的产品名称与 d1
中的相应列进行匹配,然后获取与 df2
中的月份编号匹配的每个索引值的值
我试过做这样的事情:
for i in df1:
df2['seasonal_index'] = df1.loc[df1.iloc[:,i] == df2['Month']]
但没有成功。希望有人能知道如何解除封锁
答案 0 :(得分:1)
你是我的朋友,这会产生你指定的输出。
import pandas as pd
# replicate df1
data1 = [[0.1855672, 0.8855672],
[0.1356667, 0.0356667],
[1.1336686, 1.7336686],
[0.9566671, 0.6566671]]
index1 = [1, 2, 3, 4]
df = pd.DataFrame(data=data1,
index= index1,
columns=['product_1', 'product_2'])
df.columns.name = 'Id'
df.index.name = 'Date'
# replicate df2
data2 = [[11.0, 3],
[18.0, 4],
[14.0, 1],
[22.0, 2]]
index2 = [pd.Timestamp('2018-03-30'),
pd.Timestamp('2018-04-30'),
pd.Timestamp('2019-01-29'),
pd.Timestamp('2019-02-28')]
df2 = pd.DataFrame(data=data2, index=index2,
columns=['product_1', 'Month'])
df2.index.name = 'Date'
# Merge your data
df3 = pd.merge(left=df2, right=df[['product_1']],
left_on='Month',
right_index=True,
how='outer',
suffixes=('', '_df2'))
df3 = df3.rename(columns={'product_1_df2': 'seasonal_index'})
print(df3)
如果您有兴趣了解为什么这是有效的,请查看解释 pandas.merge 函数的链接。请特别注意,对于您的数据帧,df2 的键是其列之一(因此我们在 pd.merge 中使用 left_on 参数),而 df 的键是其索引(因此我们在 pd.merge 中使用 right_index 参数)。< /p>
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html