考虑以下单个索引DataFrame:
1 vitamin-c 0.0004
vitamin-a 0.0150
2 vitamin-c 0.0030
3 vitamin-d 1.2000
vitamin-e 1.0007
vitamin-c 1.2020
4 vitamin-a 0.0780
5 vitamin-b 0.9650
6 vitamin-e 1.9801
vitamin-c 1.0011
我还有一个多索引系列:
energy fat vitamins
1 2000 28 vitamin-c 0.0004
vitamin-a 0.0150
2 1900 17 vitamin-c 0.0030
3 2200 30 vitamin-d 1.2000
vitamin-e 1.0007
vitamin-c 1.2020
4 1750 15 vitamin-a 0.0780
5 1800 18 vitamin-b 0.9650
6 1600 12 vitamin-e 1.9801
vitamin-c 1.0011
我如何加入这两者,结果如下:
df.join(series, how = 'inner')
我尝试了"ValueError: cannot join with no level specified and no overlapping names"
,但我收到的是以下错误消息:
notificationChannel.setSound(null, null);
有人可以解释一下我在这里做错了什么以及如何实现两者的结合?谢谢!
答案 0 :(得分:3)
选项1
我并不建议将事情转移到不应该存在的指数中
也就是说,如果您的索引级别被恰当地命名,或者它们匹配,那么您可以使用pd.DataFrame.join
,以便大熊猫知道要加入的内容。
df.rename_axis('ord').join(s.rename_axis(['ord', 'vit']).rename('val'))
energy fat val
ord vit
1 vitamin-c 2000 28 0.0004
vitamin-a 2000 28 0.0150
2 vitamin-c 1900 17 0.0030
3 vitamin-d 2200 30 1.2000
vitamin-e 2200 30 1.0007
vitamin-c 2200 30 1.2020
4 vitamin-a 1750 15 0.0780
5 vitamin-b 1800 18 0.9650
6 vitamin-e 1600 12 1.9801
vitamin-c 1600 12 1.0011
在更多行中添加可读性
s = s.rename_axis(['ord', 'vit']).rename('val')
df = df.rename_axis('ord')
df.join(s)
energy fat val
ord vit
1 vitamin-c 2000 28 0.0004
vitamin-a 2000 28 0.0150
2 vitamin-c 1900 17 0.0030
3 vitamin-d 2200 30 1.2000
vitamin-e 2200 30 1.0007
vitamin-c 2200 30 1.2020
4 vitamin-a 1750 15 0.0780
5 vitamin-b 1800 18 0.9650
6 vitamin-e 1600 12 1.9801
vitamin-c 1600 12 1.0011
选项2
我们还可以将pd.concat
与loc
和pd.Index.get_level_values
pd.concat(
[df.loc[s.index.get_level_values(0)].set_index(s.index), s.rename('val')],
axis=1
)
energy fat val
1 vitamin-c 2000 28 0.0004
vitamin-a 2000 28 0.0150
2 vitamin-c 1900 17 0.0030
3 vitamin-d 2200 30 1.2000
vitamin-e 2200 30 1.0007
vitamin-c 2200 30 1.2020
4 vitamin-a 1750 15 0.0780
5 vitamin-b 1800 18 0.9650
6 vitamin-e 1600 12 1.9801
vitamin-c 1600 12 1.0011
答案 1 :(得分:2)
来源集:
In [96]: s
Out[96]:
id vitamins
1.0 vitamin-c 0.0004
vitamin-a 0.0150
2.0 vitamin-c 0.0030
3.0 vitamin-d 1.2000
vitamin-e 1.0007
vitamin-c 1.2020
4.0 vitamin-a 0.0780
5.0 vitamin-b 0.9650
6.0 vitamin-e 1.9801
vitamin-c 1.0011
Name: val, dtype: float64
In [97]: df
Out[97]:
energy fat
1 2000 28
2 1900 17
3 2200 30
4 1750 15
5 1800 18
6 1600 12
解决方案:
In [99]: s.reset_index() \
.merge(df, left_on='id', right_index=True) \
.set_index(['id','energy','fat','vitamins'])
Out[99]:
val
id energy fat vitamins
1.0 2000 28 vitamin-c 0.0004
vitamin-a 0.0150
2.0 1900 17 vitamin-c 0.0030
3.0 2200 30 vitamin-d 1.2000
vitamin-e 1.0007
vitamin-c 1.2020
4.0 1750 15 vitamin-a 0.0780
5.0 1800 18 vitamin-b 0.9650
6.0 1600 12 vitamin-e 1.9801
vitamin-c 1.0011
答案 2 :(得分:2)
如果您为索引/多索引添加名称,则可以使用联接:
In [11]: df
Out[11]:
energy fat
n
1 2000 28
2 1900 17
3 2200 30
4 1750 15
5 1800 18
6 1600 12
In [12]: df2
Out[12]:
val
n vitamin
1 vitamin-c 0.0004
vitamin-a 0.0150
2 vitamin-c 0.0030
3 vitamin-d 1.2000
vitamin-e 1.0007
vitamin-c 1.2020
4 vitamin-a 0.0780
5 vitamin-b 0.9650
6 vitamin-e 1.9801
vitamin-c 1.0011
In [13]: df.join(df2)
Out[13]:
energy fat val
n vitamin
1 vitamin-c 2000 28 0.0004
vitamin-a 2000 28 0.0150
2 vitamin-c 1900 17 0.0030
3 vitamin-d 2200 30 1.2000
vitamin-e 2200 30 1.0007
vitamin-c 2200 30 1.2020
4 vitamin-a 1750 15 0.0780
5 vitamin-b 1800 18 0.9650
6 vitamin-e 1600 12 1.9801
vitamin-c 1600 12 1.0011
注意:通过设置.index.names:
来执行此操作In [21]: df.index.names = ["n"] # or .name = "n"
In [22]: df2.index.names = ["n", "vitamin"]