在庞大的数据框架上启用完整的pandas摘要

时间:2012-11-29 16:18:08

标签: python pandas options summary output-formatting

我有一个大数据框。通常,当我有这样的数据框时,我得到该数据框的摘要,在那里我得到每个列和列名称中有多少非NaN值的信息。然而,对于这个我得到一个更短的总结:

<class 'pandas.core.frame.DataFrame'>
Index: 138289 entries, 1993-07-23 to 2012-11-26
Columns: 101 entries, AAT to ZZT
dtypes: object(101)

我想获得一个标准摘要,其中包含每列的信息。

我正在使用ipython notebook和pandas 0.9.1,如果它与它有任何关系

3 个答案:

答案 0 :(得分:4)

遗憾的是,DataFrame.info被黑客攻击不显示完整摘要,除非列数少于100(查看源代码)。我们将它固定为0.10:

https://github.com/pydata/pandas/issues/2524

答案 1 :(得分:3)

尝试使用set_printoptions

设置DataFrame中显示的最大行数
pd.set_printoptions(max_columns=101)

这应该允许您查看(汇总的)DataFrame中的所有列。

  

max_rowsmax_columns控制默认显示的DataFrame对象的行数和列数。

答案 2 :(得分:1)

当数据帧很大时,它不会显示在ipython笔记本中。 我只是强迫它:

from IPython.display import HTML
HTML(df.head().to_html())

确保使用head:)