Python:在数据的直方图上可视化正常曲线

时间:2014-11-24 22:41:57

标签: python pandas

提前感谢任何帮助或提示。

我试图想象一下我的数据框专栏的拟合法线。到目前为止,我已经能够通过以下方式绘制直方图:

df.radon_adj.hist(bins=30)

hist

我已经{' template'但我遇到了错误。

import pylab as py
import numpy as np
from scipy import optimize

# Generate a 
y = df.radon_adj
data = py.hist(y, bins = 25)

# Equation for Gaussian
def f(x, a, b, c):
    return a * py.exp(-(x - b)**2.0 / (2 * c**2))

# Generate data from bins as a set of points 
x = [0.5 * (data[1][i] + data[1][i+1]) for i in xrange(len(data[1])-1)]
y = data[0]

popt, pcov = optimize.curve_fit(f, x, y)

x_fit = py.linspace(x[0], x[-1], 100)
y_fit = f(x_fit, *popt)

plot(x_fit, y_fit, lw=4, color="r")

1 个答案:

答案 0 :(得分:6)

我不会通过定义高斯方程来重新发明轮子。站在scipy包的肩膀上:

from scipy.stats import norm  
df = pd.DataFrame({'A': np.random.normal(size=100)})

df.A.plot(kind='hist', normed=True)

range = np.arange(-4, 4, 0.001)
plt.plot(range, norm.pdf(range,0,1))

enter image description here

请注意,唯一的魔法'这里确保直方图是标准的。