我有两个数据帧df_binary和df_pim。
df_binary是形状(462,38),而df_pim是形状(36,34)。他们看起来像这样:df_binary:
Cust_ID Email Topwater Topwater Topwater ... Plastic Plastic Plastic
12345 i@me.com 1 0 0 1 1 0
...
df_pim:
Bait Name Technique 1 Technique 2 Technique 3 ... Technique 33
Topwater 1 1 1 0
...
Plastic 1 0 0 1
我希望输出看起来像这样:
df_technique:
Cust_ID Email Technique 1 Technique 2 Technique 3 ... Technique 33
12345 i@me.com 4 1 2 1
“技术”列是df_binary行和df_pim列的点积。
经过一段时间的努力,以下是我到目前为止的三项尝试:
# Try 1
df_pim.iloc[:,1:].mul(df_binary)
# Try 2
df_binary.iloc[:,2:].dot(df_pim.values)
# Try 3
df_binary.iloc[:,2:].multiply(df_pim,axis='index')
答案 0 :(得分:1)
该问题似乎来自以下事实:您在df_binary中增加了2个Cust_ID和Email列,导致您的尺寸与矩阵乘法不兼容。请尝试以下操作:
df_binary = df_binary.set_index(['Cust_id', 'Email'])
df_technique = df_binary.dot(df_pim.values)
df_techique.columns = df_pim.columns
# If you want to remove layered indicies after dot product multiplication:
df_technique.reset_index() #or set to whatever index you need.
如果您不想处理多层索引,则以后可以随时重置索引。