我是Pandas和ML的新手。我正在阅读这本书 Think Stats 并参加练习。随附的代码将NSFG Cycle 6数据加载为编码示例的数据帧。 其中一个练习指示用户使用数据框中的可用功能来显示名为' preglngth'的系列。然后它要求用NSFG的Codebook交叉检查结果。我的代码如下,
import nsfg
df = nsfg.ReadFemPreg()
df.prglngth.value_counts(sort=True)
我得到以下输出,
+----------------+ | 39 4744 | | 40 1120 | | 38 609 | | 9 594 | | 41 591 | | 6 543 | | 37 457 | | 13 446 | | 4 412 | | 8 409 | | 35 357 | | 36 329 | +----------------+
依旧......
名称:prglngth,dtype:int64
代码簿link以下列方式显示它,
我想根据上面显示的索引值范围显示Series值。我该怎么办? 感谢。
Krish。
答案 0 :(得分:0)
pd.qcut()功能可帮助您存储值。您想要对索引值进行bin,因此您可以在groupby函数中传递它们。
s = df.prglngth.value_counts(sort=True)
s.groupby(pd.cut(s.index, [0, 13.5, 26.5, 100])).sum()