我正在使用df.iterrows()循环数据框。我想设置每次访问的行数,而不是遍历所有行。首先,我想访问前两行,然后是第三行到第六行,然后是剩下的。有没有办法循环遍历行?
这就是我所拥有的:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))
df['key1'] = 0
df.key1.iloc[0:3] = 1
df.key1.iloc[3:7] = 2
df.key1.iloc[7:] = 3
df_grouped = df.groupby('key1')
for group_name, group_value in df_grouped:
fig, axes = plt.subplots(rows, 1, sharex=True, sharey=True, figsize= (15, 20))
for i,r in group_value.iterrows():
rows, columns = group_value.shape
r = r[0:columns-1]
r.plot(kind='bar', fill=False, log=False)
答案 0 :(得分:1)
您可以根据条件创建一个列,然后在该列上执行一个组并迭代分组数据。
df = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))
df['key1'] = 0
df.key1.iloc[1:3] = 1
df.key1.iloc[3:7] = 2
df.key1.iloc[7:] = 3
df_grouped = df.groupby('key1')
for group_name, group_value in df_grouped:
for i,r in group_value.iterrows():
print i, max(r[:-1])
print '-' * 80