我有一个看起来像这样的数据框:
TransactionId Value
Timestamp
2018-01-07 22:00:00.000 633025 674.87
2018-01-07 22:15:00.000 633025 676.11
2018-01-07 22:30:00.000 633025 677.06
我想根据其他2列的条件创建具有3种可能类别的第三列。我尝试在下面编写函数,但无法正常工作-调用函数后调用df.head()时没有得到回报。
b = df.shape[0]
def charger_state(df):
a = 1
while a <= b:
if df.Value[a]-df.Value[(a-1)] > 0.1 :
df['Charger State']= "Charging"
elif df.Value[a]-df.Value[(a-1)] < 0.1 \
and df['TransactionId'] > 0:
df['Charger State']= "Not Charging"
else:
df['Charger State']= "Vacant"
a = a+1
围绕该主题的其他答案似乎并未涵盖新专栏的3个类,但我是新手,所以可能无法理解。
答案 0 :(得分:3)
首先,设置您的条件:
c1 = df.Value.sub(df.Value.shift()).gt(0.1)
c2 = df.Value.diff().lt(0.1) & df.TransactionId.gt(0)
现在使用np.select
:
df.assign(ChargerState=np.select([c1, c2], ['Charging', 'Not Charging'], 'Vacant'))
TransactionId Value ChargerState
Timestamp
2018-01-07 22:00:00 633025 674.87 Vacant
2018-01-07 22:15:00 633025 676.11 Charging
2018-01-07 22:30:00 633025 677.06 Charging
您可能需要调整c1
,因为在此示例中,尽管它同时具有TransactionId
和Value
,但由于存在没有上一行。
一个可能的选择是假设如果设备具有Vacant
和Value
,则它已经开始充电,我们可以使用TransactionID
来完成充电。在fillna
上
c1
c1 = df.Value.sub(df.Value.shift().fillna(0)).gt(0.1) # Notice the fillna
c2 = df.Value.diff().lt(0.1) & df.TransactionId.gt(0)
df.assign(ChargerState=np.select([c1, c2], ['Charging', 'Not Charging'], 'Vacant'))