从多个数据框创建单个箱线图

时间:2018-10-18 06:52:19

标签: python pandas dataframe matplotlib

我有三个数据框,它们仅包含一列“时间”和不同的熊猫datetime值行数。例如:

      Time
0  3 days    
1  16 days   
2  6 days     
3  4 days     
4  4 days     
5  4 days     

我想创建一个单框图(烛台),它具有三个条形并排显示所有数据帧中时间的分布。 我该如何做到这一点?

1 个答案:

答案 0 :(得分:2)

您可以通过在每个数据框中添加一列来完成此操作,该列包含用于对单个值进行分组的信息。这是一个小例子:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

我只生成了一些随机的int值。

time1 = pd.DataFrame(np.random.randint(1,30,10), columns=['Time'] )
time2 = pd.DataFrame(np.random.randint(1,30,10), columns=['Time'] )
time3 = pd.DataFrame(np.random.randint(1,30,10), columns=['Time'] )

您也可以使用窗格int代替Timedelta值。但是,您需要获取天数。

time1 = pd.DataFrame([pd.Timedelta(days=random.randint(0,30)).days for x in range(10)], columns=['Time'] )
time2 = pd.DataFrame([pd.Timedelta(days=random.randint(0,30)).days for x in range(10)], columns=['Time'] )
time3 = pd.DataFrame([pd.Timedelta(days=random.randint(0,30)).days for x in range(10)], columns=['Time'] )

然后,我将“数据”列添加到每个具有唯一标识符的数据框。

time1["Data"] = "A"
time2["Data"] = "B"
time3["Data"] = "C"

现在,我将所有数据框连接起来。

times = [time1, time2, time3]
allTimes = pd.concat(times)

使用boxplot方法,您现在可以按“数据”列对数据进行分组

plt.figure()
allTimes.boxplot(by="Data")

这将产生以下图像:

enter image description here