我手边有一个距离矩阵,我希望得到它的最大值,最小值,平均值,中值等值;期待describe()为我做,但看起来我错了。 from scipy.stats import describe
和df.describe()
都可以在列或行上工作。
除了分别调用每种方法之外,还有什么其他方法?
答案 0 :(得分:1)
将2-D DataFrame转换为1-D系列:
series = pd.Series(df.values.ravel())
然后拨打series.describe()
。
例如,
In [24]: df = pd.DataFrame(np.random.random((5,4)))
In [25]: series = pd.Series(df.values.ravel())
In [26]: series.describe()
Out[26]:
count 20.000000
mean 0.514002
std 0.332819
min 0.001209
25% 0.298695
50% 0.528073
75% 0.804711
max 0.973840
dtype: float64