截断熊猫数据框中的行数

时间:2018-12-21 18:39:17

标签: python pandas

是否存在一种方法来限制熊猫数据框中的行数,或者最好通过建立索引来做到这一点,例如:

LIMIT = 1000
df = df[:LIMIT]

我问这个原因是因为我可能有数百万行的数据帧,并且我想确保此调用尽可能高效,因为我会相当多地调用它。

2 个答案:

答案 0 :(得分:1)

如果您试图限制显示的行数,那么下一个命令将很有用:

limit = 1000
pd.options.display.max_rows = limit

或者您可以尝试下一个:

limit = 1000
pd.set_option("display.max_rows",limit)

答案 1 :(得分:1)

总是有可用的选项,但是您需要具体说明所需的内容。

我个人使用以下设置:

##### Python pandas, widen output display to see more columns & row. ####
pd.set_option('display.height', 100)
pd.set_option('display.max_rows', 100)
pd.set_option('display.max_columns', 100)
pd.set_option('display.width', 100)
pd.set_option('expand_frame_repr', True)

100仅是示例,您实际上并不需要分配变量。

提取熊猫数据框的子集:

这是数据框子集部分的通用语法规则,

df.loc[startrow:endrow, startcolumn:endcolumn]

OR,例如只选择开头的1000行,我们可以使用以下方法:

df[:1000]