我有pd数据帧(数据),有三列,X,Y和Z。
我需要运行以下内容:
X * Y其中Z ='值'
我的工作方式是:
data[data['Z'] == 'value',[data['X']*data['Y']]]
现在我知道这不正确,但我能闻到正确的答案。有人能指出我正确的方向吗?
答案 0 :(得分:6)
IIUC:
(df.X * df.Y).where(df.Z == 'Value')
或
df[df.Z == 'Value'].eval('X * Y')
示例:
np.random.seed(123)
df = pd.DataFrame({'X':np.arange(10),'Y':np.arange(10),'Z':np.random.choice(['Value',np.nan],10)})
(df.X * df.Y).where(df.Z == 'Value')
0 0.0
1 NaN
2 4.0
3 9.0
4 16.0
5 25.0
6 36.0
7 NaN
8 NaN
9 81.0
dtype: float64
或者
df[df.Z == 'Value'].eval('X * Y')
0 0
2 4
3 9
4 16
5 25
6 36
9 81
dtype: int32
答案 1 :(得分:3)
<强>设置强>
借用@ScottBoston
np.random.seed(123)
df = pd.DataFrame({
'X':np.arange(10),
'Y':np.arange(10),
'Z':np.random.choice(['Value',np.nan],10)
})
解决方案
df.loc[df.Z.eq('Value'), ['X', 'Y']].prod(1)
0 0
2 4
3 9
4 16
5 25
6 36
9 81
dtype: int64
答案 2 :(得分:1)
data.loc[data['Z'] == 'value', 'Z'] = data.loc[data['Z'] == 'value', 'X'] * data.loc[data['Z'] == 'value', 'Y']
这是一个有效的例子:
dataframe = pd.DataFrame({'X': [1, 2, 3, 4, 5, 6],
'Y': [5, 6, 7, 8, 9, 0],
'Z': [0, 1, 0, 1, 0, 1]})
dataframe.loc[dataframe['Z'] == 0, 'Z'] = dataframe.loc[dataframe['Z'] == 0, 'X'] * dataframe.loc[dataframe['Z'] == 0, 'Y']
print(dataframe)
# X Y Z
# 0 1 5 5
# 1 2 6 1
# 2 3 7 21
# 3 4 8 1
# 4 5 9 45
# 5 6 0 1
答案 3 :(得分:1)
我认为你想要像这样闷闷不乐:
import pandas as pd
import numpy as np
df_original = pd.DataFrame({'X': [1, 2, 3, 4, 5, 6],
'Y': [7, 8, 9, 10, 11, 12],
'Z': [False, True, True, True, False, False]})
df_original['X*Y'] = np.where(df_original.Z == True, df_original.X * df_original.Y, df_original.Z)
#In this case True or False are the conditios or "Value", but you can put any value you want.
输出:
X Y Z X*Y
0 1 7 False 0
1 2 8 True 16
2 3 9 True 27
3 4 10 True 40
4 5 11 False 0
5 6 12 False 0