我想比较两种不同的分布,其中一个有100个数据点,另外150个数据点。
在seaborn
中,我可以通过以下方式使用lmplot
执行此操作:
import pandas as pd
import seaborn as sns
df = pd.DataFrame(data)
sns.lmplot(x="dist1", y="dist2", data=df)
将输入pandas
DataFrame视为由两列dist1
和dist2
组成,每列具有相同数量的数据点。
但是,这仅适用于相同大小的分布。因此,我在考虑采用每个分布的百分位数。 是否已经实现了这样的情节(例如matplotlib,seaborn,statsmodels,plotly ......)?
关于结束投票:这个问题不属于CrossValidated SE,因为我清楚地询问代码或库API来比较两个分布,而不是关于分布的理论问题或分析它们的统计方法。这里的分发我的意思是:数据点集。
答案 0 :(得分:0)
假设想要在同一轴上放置两个数据集,请参阅this。您需要引用要绘制的轴。
样品:
a = [1.1, 2.8, 14, 21, 23]
b = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
fig, ax1 = plt.subplots()
ax1.scatter(range(len(a)), a)
ax1.scatter(range(len(b)), b)