将特定功能应用于熊猫中数据框的列

时间:2020-07-08 12:33:38

标签: python pandas

我有一个如下所示的数据框

Date                         in_days
2020-02-01                   1
2020-02-06                   6
2020-02-09                   9
2020-02-03                   3
2020-02-11                   11
2020-02-21                   21
2020-02-13                   13
2020-02-29                   29
2020-02-26                   26

我想创建一个函数,该函数将从in_days创建一个名为t_factor的新列,如下所示。

t = in_days

if  0 < in_days <= 4:
    t_factor = (3*in_days) + 2
else if 4 < in_days <= 12:
    t_factor = 14
else:
    t_factor = (in_days)**2 + (2*in_days) + 2

预期输出:

Date                         in_days      t_factor
2020-02-01                   1            5
2020-02-06                   6            14     
2020-02-09                   9            14
2020-02-03                   3            11
2020-02-11                   11           14
2020-02-20                   20           442
2020-02-13                   10           12
2020-02-29                   25           677
2020-02-26                   2            8

2 个答案:

答案 0 :(得分:2)

您代码中的

tin_days相同。在这种情况下,您可以执行以下操作:

df['t_factor'] = np.select( (df['in_days'].gt(0) & df['in_days'].le(4),
                             df['in_days'].gt(4) & df['in_days'].le(12)),
                            (df['in_days']*3+2, 14),   # is this 12 or 14?
                            df['in_days']**2 + df['in_days']*2 + 2)

输出:

         Date  in_days  t_factor
0  2020-02-01        1         5
1  2020-02-06        6        14
2  2020-02-09        9        14
3  2020-02-03        3        11
4  2020-02-11       11        14
5  2020-02-20       20       442
6  2020-02-13       10        14
7  2020-02-29       25       677
8  2020-02-26        2         8

答案 1 :(得分:1)

您可以使用map函数,如下所述:

df['A'].map(multiply)

其中multiply是要应用的函数名称。