使用Python比较两个不同大小的发行版

时间:2016-08-26 15:36:18

标签: python matplotlib distribution seaborn percentile

我想比较两种不同的分布,其中一个有100个数据点,另外150个数据点。

seaborn中,我可以通过以下方式使用lmplot执行此操作:

import pandas as pd
import seaborn as sns

df = pd.DataFrame(data)
sns.lmplot(x="dist1", y="dist2", data=df)

将输入pandas DataFrame视为由两列dist1dist2组成,每列具有相同数量的数据点。

但是,这仅适用于相同大小的分布。因此,我在考虑采用每个分布的百分位数。 是否已经实现了这样的情节(例如matplotlib,seaborn,statsmodels,plotly ......)?

修改

关于结束投票:这个问题不属于CrossValidated SE,因为我清楚地询问代码或库API来比较两个分布,而不是关于分布的理论问题或分析它们的统计方法。这里的分发我的意思是:数据点集。

1 个答案:

答案 0 :(得分:0)

假设想要在同一轴上放置两个数据集,请参阅this。您需要引用要绘制的轴。

样品:

a = [1.1, 2.8, 14, 21, 23]
b = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

fig, ax1 = plt.subplots()
ax1.scatter(range(len(a)), a)
ax1.scatter(range(len(b)), b)