我正在使用pandas进行数据调整,我似乎无法弄清楚看起来像是一个基本的合并。基本上,我在数据集上有多个描述方法。 describe方法的输出如下所示。我在这个例子中使用了简单的数字。列的名称相同(Metric4)。
Metric4
count 10
mean 15
std 28
min 86
25% 10
50% 12
75% 13
max 18
Metric4
count 15
mean 26
std 26
min 86
25% 10
50% 12
75% 13
max 18
我想将这些合并在一起是为了获得如下所示的输出:
Metric4 Metric42
count 15 10
mean 26 15
std 26 28
min 86 86
25% 10 10
50% 12 12
75% 13 13
max 18 18
我想我想更改列名称以区分这两者,但我目前遇到的主要问题是合并。任何帮助将不胜感激。
答案 0 :(得分:2)
这是merge
的一个相当简单的例子,您可以在其中为后缀提供额外的suffixes=('', '2')
参数:
In [95]:
df0 = pd.DataFrame({'Metric4':np.random.randn(10)})
df1 = pd.DataFrame({'Metric4':np.random.randn(10)})
In [96]:
print pd.merge(df0.describe(), df1.describe(), left_index=True, right_index=True, suffixes=('', '2'))
Metric4 Metric42
count 10.000000 10.000000
mean 0.304794 -0.061428
std 1.536658 1.388435
min -1.955994 -2.320610
25% -1.102251 -1.357967
50% 0.718339 0.289702
75% 1.262556 1.211371
max 2.571758 1.341736