Question

我有一个像这样的数据框，

import pandas as pd
d = {'col1': ["2004-02-26", "2004-02-27", "2004-03-01",
              "2004-03-02", "2004-03-03", "2004-03-04",
              "2004-03-05", "2004-03-08", "2004-03-09",
              "2004-03-10", "2004-03-11", "2004-03-12"],
     'col2': [-3, 4, 5, 3, -1, 11, 123, 43, -5, 3, -4, -7],
     'col3': [0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0,]}
df = pd.DataFrame(data=d)
print(df)

打印出来，

              col1  col2  col3
    0   2004-02-26    -3     0
    1   2004-02-27     4     1
    2   2004-03-01     5     0
    3   2004-03-02     3     0
    4   2004-03-03    -1     1
    5   2004-03-04    11     0
    6   2004-03-05   123     0
    7   2004-03-08    43     0
    8   2004-03-09    -5     0
    9   2004-03-10     3     1
    10  2004-03-11    -4     1
    11  2004-03-12    -7     0

您可以在df['col2']中看到，正值由几个负值分隔。我想选择每组正值的头尾行到一个新的数据帧。如果只有一个正排停留在nagetives的中间，我认为头部和尾部是相同的。

例如，

head_date  col2h  co3h    tail_date  col2t  col3t
2004-02-27     4     1     2004-03-02     3     0
2004-03-04    11     0     2004-03-08    43     0
2004-03-10     3     1     2004-03-10     3     1

我在考虑当第（i）行col2＆lt; 0和第（i + 1）行col2＆gt; 0时选择行，返回i + 1行值，以及当（i）第2行col2＆gt; ; 0和第（i + 1）行col2＆lt; 0，返回i行值。但感觉有点困惑。

我希望我能清楚地描述这个问题。真的希望有人可以帮助我。

Answer 1

像这样的东西

df1 = df.loc[(df['col2'].shift() < 0) & (df['col2'] > 0)].copy()
df1.rename(columns = {'col1': 'head_date', 'col2': 'col2h', 'col3': 'col3h'}, inplace = True)

df2 = df.loc[(df['col2'].shift(-1) < 0) & (df['col2'] > 0)].copy()
df2.rename(columns = {'col1': 'head_date', 'col2': 'col2t', 'col3': 'col3t'})

new_df = pd.concat([df1.reset_index(drop = True), df2.reset_index(drop = True)], axis = 1)

你得到了

    head_date   col2h   col3h   head_date   col2t   col3t
0   2004-02-27  4       1       2004-03-02  3       0
1   2004-03-04  11      0       2004-03-08  43      0
2   2004-03-10  3       1       2004-03-10  3       1

如何迭代数据帧然后在python中返回行值？

1 个答案: