pandas数据帧中的条件替换

时间:2018-04-27 22:43:07

标签: python pandas dataframe

new_df['year'].describe()

count    10866.000000
mean      2004.009939
std         14.958790
min       1968.000000
25%       1996.000000
50%       2006.000000
75%       2012.000000
max       2067.000000
Name: year, dtype: float64

似乎错误的年份值是+ 100年(即2067应该是1967年)。因此,对于2018年以上的值,如何在保持其余值不受影响的情况下[年 - 100]?

1 个答案:

答案 0 :(得分:1)

您可以使用pd.DataFrame.loc

new_df.loc[new_df['year'] > 2018, 'year'] -= 100