我正在尝试创建具有给定自由度d1和d2的f分布随机数,并绘制具有f分布随机数的直方图,并绘制理想化的f分布曲线,但是当我给出小值时df' s,直方图没有显示出来。我是统计学和matplotlib的新手,我无法弄清楚如何处理这个问题。 这是我的代码:
def distF(request, distribution_id):
dist = get_object_or_404(Distribution, pk=distribution_id)
dfd = dist.var4
dfn = dist.var2
x = np.random.f(dfn, dfd, size = dist.var3)
num_bins = 50
fig, ax = plt.subplots()
print(x)
# the histogram of the data
n, bins, patches = ax.hist(x, num_bins, normed=True)
y = np.linspace(0, 5, 1001)[1:]
dist = st.f(dfn, dfd, 0)
#y = np.linspace(st.f.ppf(0.01, dfn, dfd), st.f.ppf(0.99, dfn, dfd), 100)
ax.plot(y, dist.pdf(y), '--')
ax.set_xlabel('Smarts')
ax.set_ylabel('Probability density')
ax.set_xlim([0, 4])
ax.set_ylim([0, 3])
fig.tight_layout()
canvas = FigureCanvas(fig)
response = HttpResponse(content_type='image/png')
canvas.print_png(response)
plt.close(fig)
return response
这是情节的样子:
具有小df值的F分布图
具有大df值的F分布图
答案 0 :(得分:0)
问题在于,dfd
为1的f分布向大数展开。因此,假设您的数组x
中的值大约为2000,但在0到2000之间只有50个区。这使得bin相当大,因此高度相当低。我认为如果你想要将你的视图限制在某个较低的数字,最好还将直方图限制为该数字。
在下面的代码中,限制为5,bin宽度为0.2。
import numpy as np
import scipy.stats as st
import matplotlib.pyplot as plt
dfn = 10
dfd =1
limit = 5
x = np.random.f(dfn, dfd, size = 100)
bins = np.arange(0, limit, 0.2)
fig, ax = plt.subplots()
# the histogram of the data
n, bins, patches = ax.hist(x, bins, normed=True)
y = np.linspace(0, limit, 1001)[1:]
dist = st.f(dfn, dfd, 0)
ax.plot(y, dist.pdf(y), '--')
ax.set_xlabel('Smarts')
ax.set_ylabel('Probability density')
ax.set_xlim([0, limit])
fig.tight_layout()
plt.show()