我正在沿着索引切片数据框并选择响应变量,但len的结果不正确:
[IN]
new_df = df.loc[:1000,'y']
len(new_df)
[OUT]
972
有什么想法?我以为len应该返回1000
答案 0 :(得分:3)
.loc
selects rows by index label value(或通过布尔掩码)。
.iloc
selects rows by ordinal position。
所以使用
df.iloc[:1000]
选择前1000行(假设为len(df) >= 1000
)。
要仅选择y
列,请使用
df['y'].iloc[:1000]