我对构建向日葵散点图感兴趣(例如,如http://www.jstatsoft.org/v08/i03/paper [PDF链接]所示)。在我编写自己的实现之前,有没有人知道现有的实现?我知道Stata和R中的函数,但我在matplotlib中寻找一个函数。
谢谢。
答案 0 :(得分:6)
我不知道任何matplotlib实现,但这并不难。在这里,我让hexbin
进行计数,然后遍历每个单元格并添加适当数量的花瓣:
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import colors
np.random.seed(0)
n = 2000
x = np.random.standard_normal(n)
y = 2.0 + 3.0 * x + 4.0 * np.random.standard_normal(n)
cmap = colors.ListedColormap(['white', 'yellow', 'orange'])
hb = plt.hexbin(x,y, bins='log', cmap=cmap, gridsize=20, edgecolor='gray')
plt.axis([-2, 2, -12, 12])
plt.title("sunflower plot")
counts = hb.get_array()
coords = hb.get_offsets()
for i, count in enumerate(counts):
x, y = coords[i,:]
count = int(10**count)
if count>3 and count<=12:
n = count // 1
if n>1:
plt.plot([x], [y], 'k.')
plt.plot([x], [y], marker=(n, 2), color='k', markersize=18)
if count>12:
n = count // 5
if n>1:
plt.plot([x], [y], 'k.')
plt.plot([x], [y], marker=(n, 2), color='k', markersize=18)
plt.show()
这里黄色是1瓣= 1,橙色1瓣= 5。
这里有一个明显的改进之处就是使用色彩映射。例如,您想预设颜色边界还是从数据中计算它们等?在这里我简单介绍了一下:我使用bins='log'
只是为了得到我使用的特定样本的黄色和橙色细胞之间的合理比例;我还对白色,黄色和橙色细胞(3和12)之间的边界进行了硬编码。
能够使用元组在matplotlib中指定标记特征,可以很容易地绘制所有不同的花瓣数。