数据帧输出的差异与教科书中的内容相比较

时间:2014-12-28 04:16:03

标签: python pandas

我有一个数据框,名称,包含名称,性别出生年份,年份等等,用于" Python for Data Analysis"书。

当我输入names时,它会在下面给我。

    name sex  births  year      prop
0        Mary   F    7065  1880  0.077643
1        Anna   F    2604  1880  0.028618
2        Emma   F    2003  1880  0.022013
3   Elizabeth   F    1939  1880  0.021309
4      Minnie   F    1746  1880  0.019188
5    Margaret   F    1578  1880  0.017342
6         Ida   F    1472  1880  0.016177
7       Alice   F    1414  1880  0.015540
8      Bertha   F    1320  1880  0.014507...

然而,在书中,它应该如下所示:

In [378]: names
Out[378]:
<class 'pandas.core.frame.DataFrame'> Int64Index: 1690784 entries, 0 to 1690783 Data columns:
name 1690784 non-null values
sex 1690784 non-null values births 1690784 non-null values
year 1690784 non-null values
prop 1690784 non-null values dtypes: float64(1), int64(2), object(2)

有人知道如何解决这个问题吗?

1 个答案:

答案 0 :(得分:2)

现代pandas应该展示的是什么,所以我不认为有什么需要修复的。如果您想要更像该表示的内容,可以致电df.info()。请注意,以下内容仅取自您显示的值,因此它显然要小得多:

In [20]: df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 9 entries, 0 to 8
Data columns (total 5 columns):
name      9 non-null object
sex       9 non-null object
births    9 non-null int64
year      9 non-null int64
prop      9 non-null object
dtypes: int64(2), object(3)
memory usage: 324.0+ bytes

我依稀记得,当过去框架足够大时,默认情况可能就是提供info一样的概述,但我无法记住细节。在任何情况下,我都不会想到任何错误。