在seaborn.jointplot中绘制两个分布

时间:2015-07-21 13:03:01

标签: python pandas matplotlib seaborn

我想在同一个seaborn jointplot中绘制两个ipython --pylab个数据帧。它看起来像这样(命令是在IPython shell中; import pandas as pd import seaborn as sns iris = sns.load_dataset('iris') df = pd.read_csv('my_dataset.csv') g = sns.jointplot('sepal_length', 'sepal_width', iris) ):

a

两个数据帧中的键是相同的 如何在同一个图中绘制我的值(当然是不同的颜色)?甚至更详细:如何绘制两个数据集,但只在顶部和侧面分配第一个?即只绘制点。

3 个答案:

答案 0 :(得分:20)

通过修改sns.JointGrid的基础数据,可以通过以下方式实现此目的。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# simulate some artificial data
# ========================================
np.random.seed(0)
data1 = np.random.multivariate_normal([0,0], [[1,0.5],[0.5,1]], size=200)
data2 = np.random.multivariate_normal([0,0], [[1,-0.8],[-0.8,1]], size=100)

# both df1 and df2 have bivaraite normals, df1.size=200, df2.size=100
df1 = pd.DataFrame(data1, columns=['x1', 'y1'])
df2 = pd.DataFrame(data2, columns=['x2', 'y2'])


# plot
# ========================================   
graph = sns.jointplot(x=df1.x1, y=df1.y1, color='r')

graph.x = df2.x2
graph.y = df2.y2
graph.plot_joint(plt.scatter, marker='x', c='b', s=50)

enter image description here

答案 1 :(得分:2)

绘制关节图后可能会更容易,更改为要绘制内容的轴,然后使用普通的pyplot或基于轴的seaborn图:

g=sns.jointplot(...)
plt.sca("axis_name")
plt.plot/plt.scatter/.../sns.kde(ax="axis_name")

轴名称为2d-Plot的ax_joint或ax_marg_x或侧面的1d Plots的ax_marg_y。

此外,如果您想使用关节图结构但是通过pyplot绘制所有图,请使用cla函数,例如:清除2d-Plot:

g.ax_joint.cla()

答案 2 :(得分:2)

我认为,更好的解决方案是将轴手柄用于sns.joinplot返回的联合和边际分布。使用这些名称(分别是ax_jointax_marg_xax_marg_y)也可以绘制边际分布图。

import seaborn as sns
import numpy as np

data1 = np.random.randn(100)
data2 = np.random.randn(100)
data3 = np.random.randn(100)
data4 = np.random.randn(100)

df1 = pd.DataFrame({'col1': data1, 'col2':data2})
df2 = pd.DataFrame({'col1': data3, 'col2':data4})

axs = sns.jointplot('col1', 'col2', data=df1)
axs.ax_joint.scatter('col1', 'col2', data=df2, c='r', marker='x')

# drawing pdf instead of histograms on the marginal axes
axs.ax_marg_x.cla()
axs.ax_marg_y.cla()
sns.distplot(df1.col1, ax=axs.ax_marg_x)
sns.distplot(df1.col2, ax=axs.ax_marg_y, vertical=True)

distplots on marginal axes