是否存在一种方法来限制熊猫数据框中的行数,或者最好通过建立索引来做到这一点,例如:
LIMIT = 1000
df = df[:LIMIT]
我问这个原因是因为我可能有数百万行的数据帧,并且我想确保此调用尽可能高效,因为我会相当多地调用它。
答案 0 :(得分:1)
如果您试图限制显示的行数,那么下一个命令将很有用:
limit = 1000
pd.options.display.max_rows = limit
或者您可以尝试下一个:
limit = 1000
pd.set_option("display.max_rows",limit)
答案 1 :(得分:1)
总是有可用的选项,但是您需要具体说明所需的内容。
我个人使用以下设置:
##### Python pandas, widen output display to see more columns & row. ####
pd.set_option('display.height', 100)
pd.set_option('display.max_rows', 100)
pd.set_option('display.max_columns', 100)
pd.set_option('display.width', 100)
pd.set_option('expand_frame_repr', True)
100仅是示例,您实际上并不需要分配变量。
这是数据框子集部分的通用语法规则,
df.loc[startrow:endrow, startcolumn:endcolumn]
OR,例如只选择开头的1000行,我们可以使用以下方法:
df[:1000]