对于以下要求,有人可能会建议我最狡猾和最有效的方法。
我有一个熊猫的数据框(d1)如下:
jam lam mam pam qam sam uam wam
0 1 1.30103 1 1 1 1 1 1
0 is the id
并且,字典(d2):
{u'bam': 1.0,
u'ham': 1.0,
u'jam': 0.82390874094431876,
u'kam': 1.0,
u'lam': 1.0,
u'mam': 0.82390874094431876,
u'pam': 1.0,
u'ram': 1.0,
u'sam': 0.82390874094431876,
u'tam': 1.0}
我的要求很简单,就是将公共实体相乘。
Example Lam->1.30103 of d1 will be multiplied to lam->(1.0) of d2
我期望的输出是一个数据帧(有点像下面):
jam lam mam pam qam sam uam wam
0 0 1.30103 0.82390 1 0 0.82 0 0
只有lam,mam,pam和sam有值,因为它们是d1和d2中的共同实体。它们的相应值也相乘。
答案 0 :(得分:3)
我从dict中构造一个df,将它们相乘,然后再次从d1中选择cols:
In [107]:
df2 = pd.DataFrame.from_dict(d2, orient='index').T
df2
Out[107]:
tam sam ram bam mam pam lam kam jam ham
0 1 0.823909 1 1 0.823909 1 1 1 0.823909 1
In [114]:
(df * df2)[df.columns].fillna(0)
Out[114]:
jam lam mam pam qam sam uam wam
0 0.823909 1.30103 0.823909 1 0 0.823909 0 0