如何使用熊猫根据行值条件更改列数据类型

时间:2019-03-22 10:48:29

标签: python python-3.x pandas

我想根据行条件更改列值的数据类型,但不起作用

Sample Data:
    eName   Value1  Value2  NValue
    sample1 XYZ XYZ XYZ
    sample2 102 XYZ 102 XYZ 102 XYZ
    sample3 3   3.000   
    sample4 3   3.000   

我尝试过这种方法,我必须使用其他方法吗?

data.loc[data.eName == 'sample3', ['Value1', 'Value2']].apply(pd.to_numeric)
data.loc[data.eName == 'sample4', ['Value1', 'Value2']].apply(pd.to_numeric)


Output as:
    eName   Value1  Value2  NValue
    sample1 XYZ     XYZ     XYZ
    sample2 102 XYZ 102 XYZ 102 XYZ
    sample3 3.00    3.00    
    sample4 3.00    3.00    

1 个答案:

答案 0 :(得分:3)

您可以将Series.isin创建的掩码分配给过滤后的DataFrame的两侧,并在必要时添加errors='coerce'以将非数字值转换为NaN

m = data.eName.isin(['sample3','sample4'])
cols = ['Value1', 'Value2']
#if need all columns without eName 
#cols = df.columns.difference(['eName'])
data.loc[m, cols] = data.loc[m , cols].apply(pd.to_numeric, errors='coerce')
print (data)
     eName   Value1   Value2   NValue
0  sample1      XYZ      XYZ      XYZ
1  sample2  102 XYZ  102 XYZ  102 XYZ
2  sample3        3        3      NaN
3  sample4        3        3      NaN

如果需要所有列而不需要第一列:

m = data.eName.isin(['sample3','sample4']).values
data.iloc[m, 1:] = data.iloc[m , 1:].apply(pd.to_numeric, errors='coerce')