Python,如何打印在索引值范围内分组的Pandas系列

时间:2016-12-08 22:18:24

标签: pandas

我是Pandas和ML的新手。我正在阅读这本书 Think Stats 并参加练习。随附的代码将NSFG Cycle 6数据加载为编码示例的数据帧。 其中一个练习指示用户使用数据框中的可用功能来显示名为' preglngth'的系列。然后它要求用NSFG的Codebook交叉检查结果。我的代码如下,

import nsfg
df = nsfg.ReadFemPreg()
df.prglngth.value_counts(sort=True)

我得到以下输出,

+----------------+  
| 39        4744 |  
| 40        1120 |  
| 38         609 |  
| 9          594 |  
| 41         591 |  
| 6          543 |  
| 37         457 |  
| 13         446 |  
| 4          412 |  
| 8          409 |  
| 35         357 |  
| 36         329 |  
+----------------+

依旧......

名称:prglngth,dtype:int64

代码簿link以下列方式显示它,

Screenclip

我想根据上面显示的索引值范围显示Series值。我该怎么办? 感谢。

Krish。

1 个答案:

答案 0 :(得分:0)

pd.qcut()功能可帮助您存储值。您想要对索引值进行bin,因此您可以在groupby函数中传递它们。

s = df.prglngth.value_counts(sort=True)
s.groupby(pd.cut(s.index, [0, 13.5, 26.5, 100])).sum()