Python - 使用散点图堆叠两个直方图

时间:2016-09-27 16:46:24

标签: python numpy matplotlib plot

有一个散点图的示例代码及其直方图

x = np.random.rand(5000,1)
y = np.random.rand(5000,1)



fig = plt.figure(figsize=(7,7))
ax = fig.add_subplot(111)
ax.scatter(x, y, facecolors='none')
ax.set_xlim(0,1)
ax.set_ylim(0,1)



fig1 = plt.figure(figsize=(7,7))
ax1 = fig1.add_subplot(111)
ax1.hist(x, bins=25, fill = None, facecolor='none', 
        edgecolor='black', linewidth = 1)



fig2 = plt.figure(figsize=(7,7))
ax2 = fig2.add_subplot(111)
ax2.hist(y, bins=25 , fill = None, facecolor='none', 
        edgecolor='black', linewidth = 1)

我想要做的就是创建这个图表,并将直方图附加到他们尊重的轴上,就像这个例子一样

enter image description here

我熟悉堆叠和合并x轴

f, (ax1, ax2, ax3) = plt.subplots(3)
ax1.scatter(x, y)
ax2.hist(x, bins=25, fill = None, facecolor='none', 
        edgecolor='black', linewidth = 1)
ax3.hist(y, bins=25 , fill = None, facecolor='none', 
        edgecolor='black', linewidth = 1)

f.subplots_adjust(hspace=0)
plt.setp([a.get_xticklabels() for a in f.axes[:-1]], visible=False)

enter image description here

但我不知道如何将直方图附加到y轴和x轴,就像我上面发布的图片一样,最重要的是,如何改变图形的大小(即使散点图更大,比较小的直方图)

2 个答案:

答案 0 :(得分:5)

Seaborn是快速统计图的方法。但是,如果您想避免其他依赖项,可以使用subplot2grid放置子图和关键字sharexsharey,以确保轴同步。

import numpy as np
import matplotlib.pyplot as plt

x = np.random.randn(100)
y = np.random.randn(100)

scatter_axes = plt.subplot2grid((3, 3), (1, 0), rowspan=2, colspan=2)
x_hist_axes = plt.subplot2grid((3, 3), (0, 0), colspan=2,
                               sharex=scatter_axes)
y_hist_axes = plt.subplot2grid((3, 3), (1, 2), rowspan=2,
                               sharey=scatter_axes)

scatter_axes.plot(x, y, '.')
x_hist_axes.hist(x)
y_hist_axes.hist(y, orientation='horizontal')

plot

在询问如何绘制某些内容之前,您应该始终查看matplotlib gallery,这可能会为您节省一些按键 - 我的意思是您不必问。画廊中实际上有两个这样的情节。不幸的是,代码已经过时,并没有利用subplot2gridthe first one使用矩形而second one使用axes_grid,这是一个有点奇怪的野兽。这就是我发布这个答案的原因。

答案 1 :(得分:2)

我认为仅使用matplotlib进行此操作很困难,但您可以使用具有seaborn功能的jointplot

import numpy as np
import pandas as pd
import seaborn as sns
sns.set(color_codes=True)

x = np.random.rand(1000,1)
y = np.random.rand(1000,1)
data = np.column_stack((x,y))
df = pd.DataFrame(data, columns=["x", "y"])

sns.jointplot(x="x", y="y", data=df);

enter image description here