是否有像熊猫所描述的更高级的功能? 通常我会继续:
r = pd.DataFrame(np.random.randn(1000), columns = ['A'])
r.describe()
我会得到一个很好的总结。就像这个:
A
count 1000.000000
mean 0.010230
std 0.982562
min -2.775969
25% -0.664840
50% 0.015452
75% 0.694440
max 3.101434
我可以在statsmodels或scipy中找到更精细的东西吗?
答案 0 :(得分:7)
from scipy.stats import describe
describe(r, axis=0)
它会给你大小,(最小,最大),平均值,方差,偏度和峰度
答案 1 :(得分:0)
import pandas_profiling as pp
eda = pp.ProfileReport(df)
display(eda)
Pandas概要分析是一个非常强大的工具,可以为您提供几乎完整的数据集EDA,包括缺失值,相关性,热图以及其他内容!
答案 2 :(得分:0)