使用scipy和matplotlib绘制分位数,中位数和传播

时间:2013-08-19 12:02:16

标签: python matplotlib scipy boxplot quantile

我是matplotlib的新手,我想创建一个情节,其中包含以下信息:

  1. 连接大约200个可变长度矢量(输入)的中位数的线
  2. 连接这些矢量的相应分位数的线。
  3. 连接相应点差的线(最大和最小点)。
  4. 所以基本上,它有点像一个连续的盒子图。

    谢谢!

1 个答案:

答案 0 :(得分:10)

仅使用scipymatplotlib(您只标记了问题中的那些库)有点冗长,但是这是你要做的(我只是为分位数做) :

import numpy as np
from scipy.stats import mstats
import matplotlib.pyplot as plt

# Create 10 columns with 100 rows of random data
rd = np.random.randn(100, 10)
# Calculate the quantiles column wise
quantiles = mstats.mquantiles(rd, axis=0)
# Plot it
labels = ['25%', '50%', '75%']
for i, q in enumerate(quantiles):
    plt.plot(q, label=labels[i])
plt.legend()

这给了你:

enter image description here

现在,我会试着说服你去尝试Pandas库:)

import numpy as np
import pandas as pd
# Create random data
rd = pd.DataFrame(np.random.randn(100, 10))
# Calculate all the desired values
df = pd.DataFrame({'mean': rd.mean(), 'median': rd.median(),
                   '25%': rd.quantile(0.25), '50%': rd.quantile(0.5),
                   '75%': rd.quantile(0.75)})
# And plot it
df.plot()

你会得到:

enter image description here

或者你可以只用一行获得所有统计数据:

rd.describe().T.drop('count', axis=1).plot()

enter image description here

注意:我删除了count,因为它不是“5号码摘要”的一部分。